心理测量学教案.doc-道客多多_道客多多docduoduo.com

资源描述

1、心理测量学Psychological Testing一、说明（一）课程性质本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习，是培养学生科学研究及掌握研究方法的基础性学科。（二）教学目的通过学习，要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好测量所要求具备的基本条件。更重要的是，通过本课程的学习要使学生熟练掌握不同心理测量的实际应用。（三）教学内容本课程的主要教学内容有：心理测量的基本内涵及其评价和测量的一般步骤和方法两部分。内容涉及一般测量解析，测量的要素及量表类型，测验信、效度、难度和

2、区分度，测量的一般步骤和方法，智力测验、人格测验等心理测验，以及心理测量的综合应用和心理测量理论的新发展等内容。（四）教学时数 54 个课时（五）教学方式课堂教学与实践应用相结合。第一编心理测量的基本内涵及其评价第一章绪论教学要点：通过本章的学习，了解测量的基本性质及其要素，测量量表的四种水平，心里测量的本质、基本条件及功能，心里测量的发展以及心理测量的道德准则等内容，对心理测量有一个概括化的了解。教学时数：10 学时教学内容：一、一般测量解析1测量(Measurement)概论2测量的分类3心理测量的种类（1）以测量对象来分，（2）以测量的目的来分，（3）以测量的方式来分类，

3、（4）以项目结构或组成形式来分，（5）按评价参照的标准分类4测量与测验（Test）、考试（Examination）、评价(Evaluation)联系与区别二、测量的要素及量表类型1测量的要素识记：单位（Unit），参照点 (Reference Point)，量表(Scale)2量表类型（1）称名量表称名变量只说明某一事物与其他事物在名称、类别或属性上的不同，并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。（2）顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量，具有等级性和次序性的特点。（3）等距变量等距变量除能表明量的相对大小外，还具有相等

4、的单位。（4）比率变量比率变量除了具有量的大小、相等单位外，还有绝对零点。三、心理测量的本质、基本条件及功能1 心理测量的本质2 编制心理测验的基本条件3 心理测量的功能（1）理论研究功能，（2）实际应用功能四、心理测量发展简史1 主观经验性考试阶段（1864 年以前）2 客观标准化测验阶段（1864 年1940 年）3 客观测验的深入发展阶段（1940 年）4 西方心理测量的发展5 心理测验在我国的发展（五）心理测量的道德准则1心理测量工作者的素质要求（1）心理测量工作的知识结构.（2）对心理测量的态度2心理测量工作者的道德准则（1）测验的保密和控制原则（2）测验中个人隐私的保护考核要求：

5、1心理测量的种类2测量与测验（Test）、考试（Examination）、评价(Evaluation)联系与区别3测量的要素及量表类型单位，参照点，量表，称名量表，顺序变量，等距变量，比率变量4.心理测量的本质、基本条件及功能5.心理测量发展简史第二章经典测验理论的基本假设教学要点：通过本章的学习，掌握经典测验理论的基本假设，心里特之及其特性，心里测量的误差和种类，以及真分数的含义等内容。教学时数：6 学时教学内容：一、心理特质（Trait）及其可测性假设1经典测验(Classical Test Theory ,CTT)理论2特质假设二、测量误差及其来源1. 测量误差的含义2误差种类

6、识记：随机误差，系统误差3误差来源（1）来自心理测量工具，（2）来自测量对象，（3）来自实测过程(二) 真分数模型及其假设1. 真分数的含义2真分数数学模型解析领会：（1）几个推理，（2）CTT 的基本含义，（3）CTT 的基本公式3经典测验理论的不足考核要求：1心理特质（Trait）及其可测性假设2测量误差及其来源3真分数模型及其假设4经典测验理论的不足第三章测验信度教学要点：通过本章的学习，掌握信度的意义，信度系数的计算，了解影响信度的主要因素以及提高信度的常用方法等内容。教学时数：4 学时教学内容：一、信度的意义1 信度指实测值和真值相差的程度2 信度指统计量与参数之间的接

7、近程度3 信度是指一种测验对相同的应试者再次测验时引起同样反应的程度二、信度系数的计算1稳定性系数2等值性系数3等值稳定性系数4 内部一致性系数5 评分者的信度系数三、提高测验信度的方法1 信度系数以多大为宜2 影响信度的因素3 提高测验信度的方法考核要求：1.信度的意义2.信度系数的计算识记：稳定性系数，等值性系数，等值稳定性系数，内部一致性系数，评分者的信度系数3.提高测验信度的方法请列举一些你所使用过或接触过的量表思考: 量表的作用是什么？你如何解释下述现象？一个很聪明的孩子，测得智商是 80 分一个学习很好的学生，考试成绩为 60 分一个人缘很好的人，人际关系测量低于常模值量表帮助我们

8、了解心理现象（心理特质），就像尺子帮助我们测量身高。思考:我们如何知道我们有多高？有两个工具：尺子 / 秤尺子的数据与我们的目测更一致，而秤盘的数据则与我们的目测不一致。因此，尺子是测量身高的有效工具效度。什么材料的尺子？钢铁（热胀冷缩）涉及到一致性的问题。信度物理不等于数学 1.70 与 1.7 的关系总结：量表是我们用来了解心理特质的工具，但这个工具是有误差的。误差要控制在一个许可的范围内。什么是误差? 误差的种类? 误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。误差分为随机误差和系统误差。高尔顿的智力观比奈的智力观判断题、选择题和问答题 SX2 = ST

9、2 + SE2ST2 = SV2 + SI2SX2 = SV2 + SI2 + SE2 稳定性可靠性一致性信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。 rXX=ST2/SX2 信度乃是一个被测团体真分数与实得分数的相关系数的平方。 rXX=P2TXSE2SI2SV2SX2ST2 思考：相关系数的平方？信度乃是一个测验 X 与它的任意一个平行测验 X的相关系数。 rXX=PXX 重测信度（Test-Retest Reliability）定义：同一量表，同一被试群体，在不同时间，两次施测，求其相关。实质：表示测验结果的稳定性。故称之为稳定性系数（Coefficient o

10、f Stability）形式：施测适当时间再施测间隔时间越长，稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的间隔不能太长。一般间隔时间不超过六个月。（即不能让被试记住上一次测验的内容，又不能让其特质发生变化，或对所学知识产生遗忘）在一般情况下，间隔施测的副本信度最低，因为很多因素有机会影响到分数。相反，校正过的分半相关，因为影响的因素少，所得的信度估计为最高。实际上，有多少种误差来源，便有多少种估计信度的方法。一个测验哪种误差大，便应该用哪种误差估计。有时一个测验需要有几

11、种信度系数，这样我们就把总分数的变异数分成不同的分支。假设对 100 个六年级学生以两个月的时间间隔先后施测一个创造力测验的 AB 两个复本，所得的等值性与稳定性系数为 0.70。我们还根据被试对每个复本的反应计算出分半信度为 0.80 （先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正）。同时，我们让另一个评分者随机抽取 50 份卷子另外评分，得到评分者信度为 0.92。然后，我们对这三种方法所产生的误差变异进行分析。一个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度（间隔施测) 1-0.70=0.30 时间与内容取样分半信度 1-

12、0.80=0.20 内容取样上述二者差异 0.30-0.20=0.10 时间取样评分者信度 1-0.92=0.08 评分者差异误差变异总和 0.20+0.10+0.08=0.38真实变异 1-0.38=0.62 一个假想测验的误差变异来源分析真实变异误差变异时间上的稳定性，复本之间的一致性，评分者之间的一致性内容取样误差时间取样误差评分者间差异62% 20% 10% 8%第四章测验的效度教学要点：通过本章的学习，掌握效度的含义，效度估计方法，了解影响信度与效度的关系，影响效度的因素以及提高信度的几种方法等内容。教学时数：10 学时教学内容：一、效度概述1 效度的一般定义及其内涵效

13、度是指测验的准确性，即测验能够测出他们所欲测的特质的程度。2 效度的统计与原理3 效度的信度关系（1）高效度，高信度（2）高信度，低效度（3）低信度，低效度二、效度的估计1966 年美国心理学会在教育心理测验值标准中将效度分为三大类：1 内容效度（Content Validity）内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2 结构效度(Construct Validity)结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3 实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。三、提

14、高测量效度的方法1 各种测量效度的要求2 提高效度的方法（1）控制系统误差，（2）精心编制量表，（3）妥善组织测验，（4）扩充样本容量，（5）适当增加测验的长度3 效度的一般定义及其内涵效度是指测验的准确性，即测验能够测出他们所欲测的特质的程度。4 效度的统计与原理5 效度与信度的关系（1）高效度，高信度（2）高信度，低效度（3）低信度，低效度四、效度的估计1966 年美国心理学会在教育心理测验值标准中将效度分为三大类：1 内容效度（Content Validity）内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2 结构效度(Construct Validity)结构效

15、度是指测验对于被称作构想的某一理论概念或特质测量的程度。3 实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。五、提高测量效度的方法1 各种测量效度的要求2 提高效度的方法（1）控制系统误差，（2）精心编制量表，（3）妥善组织测验，（4）扩充样本容量，（5）适当增加测验的长度考核要求：1.效度的一般定义及其内涵2.效度的统计与原理3效度与度的信度关系4.效度的估计内容效度，结构效度，实证效度5.提高测量效度的方法第五章测验的难度和区分度教学要点：通过本章的学习，掌握测验难度和区分度的含义，以及难度、区

16、分度的计算，了解难度、区分度对测验质量的影响等内容。教学时数：10 学时教学内容：一、测验难度的计算1 计算难度的基本公式（1）以试题通过率计算难度：P=R/N，（2）用平均数计算试题的难度2 用极端分组法计算难度二、难度的转换难度转换的方法三、测验题目难度水平的确定四、区分度的定义1 定义：区分度是指测验对于考生实际水平的区分度程度或鉴别能力。2 区分度与测验信度、难度的关系五、区分度计算1 用极端分组法计算（1）客观题计算，（2）论文题计算2 用内部一致性系数（Internal Consistency）计算区分度(1)用点二列相关计算区分度(2)用二列相关计算区分度(3)用相

17、关计算区分度(4)用四分相关计算区分度(5)用皮尔逊相关法计算区分度（6）D（鉴别指数）的经验标准考核要求：1.测验难度的计算2.计算难度的基本公式3难度的转换 4.测验题目难度水平的确定5.区分度的含义6.区分度与测验信度、难度的关系7.区分度计算用极端分组法计算，用内部一致性系数（Internal Consistency）计算区分度第二编测量的一般步骤和方法第六章测验的编制与实施教学要点：通过本章的学习，掌握编制测验的基本程序，测验的实施过程及须注意的事项等内容。教学时数：10 学时教学内容：第一节编制心理与教育测验的基本程序一、确定测验的目的1 明确测量对象2 明确测量目标3

18、明确测量用途二、制定编题计划三、编辑测验项目1 收集测验资料2 选择项目形式3 编写测验项目四、测验与项目分析1 预测2 项目分析五、合成测验1 测验项目的选择2 测验项目的编排3 编制副本六、测验标准化1 测验内容2 实测过程3 测验评分4 测验分数解释七、鉴定测验1 信度2 效度3 测验量表与常模八、编写测验说明书第二节测验的实施一、测验的实施过程1 实测前的准备工作2 指导语3 测验情境4 测验焦虑5 与受测者建立良好的协调关系6 评分技术二、测验分数的解释1 如何看待测验分数的意义2 如何向受测者报告测验分数考核要求：1. 编制测验的基本程序确定测验的目的，制定编

19、题计划，编辑测验项目，测验与项目分析，合成测验，测验标准化，鉴定测验，编写测验说明书2测验的实施过程及须注意的事项等内容3.测验分数的解释第七章测验分数的解释与应用教学要点：通过本章的学习，掌握测验分数的类型，常模及常模类型，以及测验分数的解释和常模的应用等内容。教学时数：4 学时教学内容：一、分数与常模1 分数的种类和含义识记：（1）原始分数，（2）导出分数2 常模3 年龄常模4 年级常模5 百分等级常模6 标准分数常模二、测验的等值1 测验等值的实质2 测验等值的条件（1）同质性，（2）等信度，（3）公平性，（4）可递推性，（5）对称性，（6）样本不变性3 测验等值的基

20、本算法识记：（1）百分位等值（2）线性等值4 常用等值设计5 测验等值误差估计考核要求：1.分数原始分数，导出分数2常模年龄常模，年级常模，百分等级常模，标准分数常模3.测验的等值的实质与条件4.测验等值的基本算法：百分位等值，线性等值第八章测验的项目分析项目分析包括定性分析和定量分析。定性分析包括考虑内容效度、题目编写的恰当性和有效性等；定量分析主要是指题目难度和区分度的测量。对项目进行筛选和修订，可以提高测验的信度和效度。第一节测验的难度一、难度（difficulty）的意义难度，指项目的难易程度。在最高作为测验中，称为“难度”，而在典型作为测验中，则指“通俗性”。两者都是指在总体中，

21、能够正确或确切回答某项目的人数。二、难度的计算（一）二分法记分项目的难度1通过率P=R/N2极端分组法（上下 27%）P=（PH+PL）/2（二）非二分法记分项目的难度P=X / XmaxX 为所有被试在该项目上的平均得分， Xmax 为该项目的满分。三、测验难度水平的确定效标参照测验、掌握测验：不考虑难度；选拔测验：难度=录取率；对于选择题来说，难度一般应大于猜测概率；无论是速度测验，还是难度测验，一般都应防止被试得满分，因为满分的意义是不明确的。大体而言，难度为 0.50 时最理想，此时项目具有最大的鉴别力。但在实际操作中，让所有项目难度都到达 0.50 困难很大，而且也不必要，一

22、般只需使项目的平均难度接近0.50，而各个项目的难度在 0.50 0.20 之间变化。四、难度的等距变换根据正态分布表，将难度 P 作为正态曲线下的面积，转换成相应的 Z 分数，这就是等距量表。P Y0 ZZ Y P.00 .39894 .00000.50 .35207 .191461.00 .24197 .341341.50 .12952 .433191.96 .05844 .475002.00 .05399 .477252.50 .01753 .493792.58 .01431 .495063.00 .00443 .498653.50 .00087 .499773.99 .00014 .

23、49997美国教育服务中心以作为难度指标：=13+4ZP = .0013 Z = +3 = 25P = .16 Z = +1 = 17P = .50 Z = 0 = 13P = .84 Z = -1 = 9P = .9987 Z = -3 = 1五、难度对测验的影响（一）测验难度影响测验分数的分布形态难度大，正偏态难度低，负偏态（二）测验难度影响测验分数的离散程度测验过难或过易，分数全距缩小，信度降低。P=0.50 时最佳第二节测验的区分度一、区分度的意义区分度（discrimination）是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”

24、。二、区分度的计算（一）项目鉴别指数法1鉴别指数（index of discrimination，D）的计算D = PH - PL取值范围：-1 +1鉴别指数题目评价0.40以上很好0.300.39 良好，修改会更好0.200.29 尚可，仍需修改0.19以下差，必须淘汰2极端组的划分27%规则一般情况下，取上下 25%33%均可。样本少时，可以取 50%注意：由于计算机的方便使用，可以上下 50%作为划分高低组的标准，或者多分几组，对区分度和难度作详细分析。因为只取上下两端，只利用了一部分资料，浪费了很多信息，有可能得出错误结论。（二）相关法（项目-总分相关）1点二列相关Xp-Xqrp

25、b= pqSt2二列相关Xp - Xq pq Xp - Xt p rb= 或 rb= St y St y3 相关ad-bcr= (a+b)(c+d)(a+c)(b+d)4四分相关5. 项目和总分相关重叠的校正当测验项目超过 20 个项目时，校正法通常毫无意义。rtpSt Sprpq = St2+ Sp2 2rtpStSp（三）项目特征曲线（item characteristic curve, ICC ）项目特征曲线描述了效标分数不同的被试在该项目上的通过率。曲线坡度越陡，鉴别力越好，预测的误差越小。率概的目项答回确正0.000.50低中高能力鉴别力较好三、区分度与难度的关系难度（）区分度

26、（）1.00 00.90 0.200.80 0.400.70 0.600.60 0.800.50 10.40 0.800.30 0.600.20 0.400.10 0.200.00 0难度和区分度都是针对一定团体而言的。一般来说，较难的项目对高水平被试区分度高，较易的项目对低水平被试的区分度高。四、区分度的相对性（一）不同的计算方法，所得区分值不同区分度有几种计算方法？（二）样本容量大小影响相关法区分度值的大小样本越大，区分度越（三）分组标准影响鉴别指数分组越极端，区分度越（四）被试样本的同质性程度影响区分度值的大小样本越同质，区分度越第三节项目分析的特殊问题一、多重选择题的项目分析（诱答

27、分析）对于多重选择题，除了分析难度和区分度外，还要对每个选项进行分析。下列哪一个最有可能是偏执型精神分裂症患者的次级症状：A 幻听B 瘫痪C 记忆丧失D 厌食如果所有被试都选择某一正确的选项，说明该选项如果没有一个被试选择某个错误选项，说明该选项如果所有被试都选择某个错误选项，说明该选项如果高分组被试的选择集中在两个选项上，说明该选项如果高分组和低分组对正确选项的选择没有区别，说明该选项如果所有被试都未回答某个题目，说明该题如果选择各个选项的人数几乎相等，说明该题二、速度测验的项目分析对前面部分的测验项目，难度和区分度都对后面部分的测验项目，难度和区分度都三、标准参照测验的项

28、目分析在标准参照测验中，无须考虑项目的难度和区分度，只要项目的内容很重要就行。也可以通过比较教学或训练的前测和后测结果来进行项目分析，用来说明教学或训练的效果以及项目编制是否适当。四、项目-团体的相互作用具有不同性质（性别、种族、职业等）的团体，在测验得分上也存在差异，即同样的项目可能有不同的难度。如果测验要求对所有个体都相对“公平”，那么，就应该排除那些有利于或不利于不同性质的亚团体的项目；如果测验的目的就是为了考察不同亚团体的差异，那么，就应选择使团体差异尽可能大的题目。五、有效性与可靠性的矛盾o 同质性信度要求项目之间有高相关，各项目的难度均等；对于预测效度来说，因为效标的变异范围

29、较大，如果项目越同质，那么效标关联效度则低；因此，效标关联效度要求各项目之间要有一定的差异，即项目之间相关低，这样才能保证测验得分与效标之间有高相关，即高的效标关联效度。因此，对于多数心理测验来说，项目之间中等程度的相关，可使二者调和，获得较为满意的（同质性）信度和（效标关联）效度。第九章学绩测验第一节学绩测验概述一、学绩测验的性质最高作为测验可以分为：学绩测验、能力测验、能力倾向测验。学绩，指经过一定的教学或训练后所学到的东西，是在一个比较明确的、相对限定的范围内的学习结果。能力倾向指学习的能力，是在给予适当的机会时获得某种知识或技能的能力。能力介于学绩和能力倾向之间，指的是当前的知识或

30、技能的水平，既有正式学习的，也有非正式学习的结果，既包括学术技能，又包括非学术技能。学绩测验用来描述现状，指明一个人已经学会了什么和能做什么。二、学绩测验的基本假设1 学绩测验所测量的知识和技术的范围能明确界定。2 测验所测量的是研究者认为重要的东西，而不是与测量目的无关的东西。3 被试有同样的机会学习测验所包含的材料。三、学绩测验的分类（一）按测验的编制方法分教师自编课堂测验，标准化学绩测验（二）按测验内容分单科测验，多科测验单元测验，总测验（三）按测验的用途分考察性测验，诊断性测验，准备性测验，选拔与安置测验，职业水平测验，用于研究的测验（四）按测验评分的参照系分常模参照性测验，目标参照性

31、测验（五）按测验的题型分客观测验，论文式测验四、学绩测验的应用1 反馈功能2 诊断功能3 辅助教学管理4 研究工具5 人才选拔与安置第二节标准化学绩测验一、标准化学绩测验的基本要求1 命题组卷标准化测验目标，试题的措辞、难度、区分度，题型比例、题量2 施测标准化环境、时间、指导语、主试3 评分标准化标准答案、评分细则、评分者人数4 测验分数解释标准化是常模参照还是目标参照二、标准化学绩测验的编制由学科专家与测验编制专家共同完成，其步骤与一般心理测验的编制程序相同。（一）确定测验目的，选定测验编制的方法考察还是诊断，常模参照还是目标参照（二）分析测量目标，拟订测验编制计划双向细目表，题型，题量

32、（三）编题征题与选题组卷编题征题试测组卷（四）调查测验质量参数，编制测验常模难度、区分度、信度、效度、常模（五）编写测验指导书，正式出版发行三、国外常用标准化学绩测验简介（一）斯坦福成就测验综合性学绩测验适用范围：19 年级内容：词汇、阅读理解、拼字、听理解、词汇学习技能、语言、数学概念、数学计算、数学应用、社会科学常识、自然科学常识斯坦福早期学校成就测验（适用于幼儿园和小学一年级）斯坦福学业技能测验（适用于 812 年级）导出分数：百分等级、标准九、年级当量、量表分数、正态曲线当量分测验信度均在 0.80 以上。（二）关键数学算术诊断测验适用范围：学前儿童小学六年级测验内容：内容块

33、：数学、分数、几何、符号运算块：加法、减法、乘法、除法、心算、数字推理应用块：文字题、补充、金钱、测量、时间诊断：总体水平诊断分块水平诊断分测验水平诊断项目水平诊断四、标准化学绩测验的题库建设一个高质量的题库应具有的性质：有一种科学的测量理论；贮备一定数量的试题，所有试题品质优良，技术参数完备；题库内部结构层次清楚、分类严谨，试题检索方便；题库管理方便，可控性强，易于维护更新；保密性强。五、我国高考的标准化试验第三节教师自编课堂测验一、教师自编课堂测验的特点测验形式灵活多变，与测验目的完全一致测验内容与教材内容完全一致测验难度切合学生的实际水平测验编制简易快速

34、二、教师自编课堂测验的步骤与方法审查测验目的制定测验编制计划命题与组卷三、教师自编课堂测验应注意的问题教师要深入研究教材，深入研究学生要维护准确稳定的合格标准要客观评价自己的命题技术，合理使用各种题型要注意总结命题经验，提高命题技术要尽量控制评分误差，防止简单粗糙要做一些定量分析研究第十章能力测验（上）第一节智力测验的理论基础（一）什么是智力？ Spearman（1904，1923）：智力是一种普遍的能力，它主要涉及联系的引出（eduction）和相关的引出。 Binet & Simon（1905）：智力是正确进行理解、判断和推理的能力。 Terman（1916 ）：智力

35、是形成概念，并且抓住其重要性的能力。 Thorndike（1921）：智力是从真理或事实角度产生良好反应的能力。 Thurstone（ 1921）：智力是抑制本能反应，灵活地想象不同反应，并且把修改后的本能反应转换为外显行为的能力。 Wechsler（1939）：智力是个体有目的地行动，理性地思考以及有效地应付环境的总体能力。 Piaget（1972 ）：智力是总括性的术语，指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。 Sternberg（1985）：智力是指自动信息加工和产生适合于新情况的行为的心理能量，它包括元成分、操作成分和知识获得成分。 Eysenck（1986）：智力是

36、将信息无错地传递过皮层的能力。 Gardner（1986）：智力是解决问题，制造在某些文化范围内有价值的产品的能力或技术。共同点：w 智力是适应环境的能力w 智力是通过经验进行学习的能力智力是人们在获得知识和运用知识解决实际问题时所必须具备的心理条件或特征。Boring(1923):智力就是智力测验所测量的东西。Sternberg 等（1981）的研究专家认为：语词能力、问题解决能力和实际智能最重要外行认为：实际问题解决能力、语词能力和社会能力最重要（二）智力的理论Galton 和感觉敏锐度1二因素论Spearman 的一般因素（G）和特殊因素（S ）2多因素论Thurstone 的群因素（语

37、文理解、言语流畅性、推理、空间想象、数字、记忆、知觉速度）5.二维结构模型希莱辛格和古特曼（1966）第一维：言语能力、数学能力、图形和空间能力第二维：规则应用能力、规则归类的能力、学术成就6 Cattell 的流体智力与晶体智力7. Gardner 的多元智力理论言语、逻辑-数学、空间、音乐、身体运动、社交、自知9 智力的认知心理学理论Sternberg智力成分：元成分、操作成分、知识获得成分智力情境：适应环境、塑造环境、选择新环境智力经验：处理新任务、自动化加工10 其他：情绪智力（EQ）、成功智力、实践性智力（ practical intelligence）第二节个体智力测验一、比内

38、量表（一）比内-西蒙量表11905 年量表世界上第一个智力量表；内容：30 道题（记忆、言语、理解、手工操作）。题目排列方式：从易到难。指标：通过项目数。如白痴最多只能通过 6 项，低能的成人可通过 715 项。眼睛是否随动的物体移动。用触觉刺激唤起抓握反应。用视觉刺激唤起抓握反应。辨认食物。搜寻食物。执行简单的命令和模仿简单的手势。认识物体。认识图片。列举图片中的人物和物体。比较两条线的长短。复述两个数字。比较两个重量。暗示。解说物体与人物的名称。复述句子。说出二物的不同点。记忆图片中的物体。靠记忆重画图片。复述数字。说出二物的相同点。比较

39、线的长短。比较重量。重量记忆。说出同韵字。填词。用三个词造句。对答问句。交换长短针的位置。剪纸。抽象名词的定义。21908 年量表内容：增至 59 道题。方式：把测验项目按年龄分组。每一岁一组。每个年龄组项目数量不等，最多 8项，最少 3 项。年龄范围：313 岁。指标：智力年龄。31911 年量表题目：删旧补新，但总数仍为 59 题。增设一个成年组。除 4 岁组仅有 4 个项目外，其他每个年龄组一律为 5 项，便于计算。对比内-西蒙量表的评价成就：（1）比西量表是第一个采用复杂任务来测量高级心理过程的测验。以前的测验主要测量感知觉、运动等低级心理过程。（2

40、）比西量表首次采用年龄作为智力的标准，这样可以对测验作出通俗易懂的解释。（3）比西量表首次从整体上测量智力，也就是测量智力的普通因素，而以往心理学家把感觉辨别力、记忆力、注意力等割裂开来测量。不足：（1）施测和记分没有标准化。（2）常模团体的代表性不够，因而有些项目的安排位置不当。（3）测验项目过少。（二）斯坦福-比内量表1斯坦福-比内量表的发展（1）1916 年量表在修改基础上增设 39 个新项目，达到 90 个项目。最早对施测和记分提供了详细的指导语。引入了智力商数的概念（比率智商）。适用年龄：313 岁。样本：1000 名儿童和 400 名成人。（2）1937 年量表由

41、L 和 M 两个等值型量表构成年龄范围扩大：1.518 岁样本：3184 名 1.518 岁儿童，但仅限城市白人（3）1960 年量表合并了 L 和 M 两型中最好的项目，改为单一量表。年龄：2成人离差智商 4498 名 1.518 岁儿童（1937 年量表的施测对象）。（4）1972 年量表测验内容未变；取样范围扩大（地区、社会阶层、经济状况、民族）。共 2100 名被试，其中 25.5 岁每半岁选 100 名，618 岁每一岁选 100 名。2斯比量表的信度和效度（1）信度复本信度：L 和 M 相关在 0.830.95 之间。再测信度：高于 0.90。（2）效度内容

42、效度：测验内容属于公认的智力范畴。效标关联效度：与学业成绩、受教育年限的相关在 0.40.75 之间。结构效度：假设智力发展随年龄增长，先快后慢（证据：随年龄增长，再测稳定性逐步提高）；存在 G 因素（证据：各项目与测验总分的平均相关为 0.66）（三）中国比内测验陆志伟和吴天敏 1924 年、1936 年、1982 年三次修订内容：51 题指标：离差智商年龄范围：2 岁18 岁生活常识知觉速度及观察力空间知觉力和想象力记忆力语言能力判断推理能力二、韦克斯勒（Wechsler）智力测验生平：1896 年出生于罗马尼亚，6 岁迁居美国。一战期间从事心理测验工作，用陆军甲、乙种测

43、验、斯比量表来甄选新兵，积累了丰富的经验。1919 年去伦敦大学，师从 Spearman 和 Pearson，接受 G 因素理论。19201922 年在巴黎与西蒙有过接触。1925 年，在哥伦比亚大学获博士学位，论文情绪反应的测量。19321967 年，任纽约贝尔韦精神病院的主任心理学家。二、韦克斯勒（Wechsler）智力测验编制背景：寻找一种测量成人智力的有效方式当时的智力测验存在下列问题：测验项目引不起成人的兴趣；过多的项目涉及语词的操作；指导语过分强调速度，牺牲了准确性；计算心理年龄，不适合成人测验要求。测验者的实际测验分数IQ=这一年龄测验者的平均测验分数韦氏智力测验家族：

44、1939 年，韦克斯勒-贝利弗测验1946 年，韦克斯勒-贝利弗测验 1949 年，韦克斯勒儿童智力量表（WISC）1955 年，韦克斯勒成人智力量表（WAIS）1967 年，韦克斯勒学前和小学儿童智力量表（WPPSI）1974 年，韦克斯勒儿童智力量表修订版（WISC-R）1981 年，韦克斯勒成人智力量表修订版（WAIS-R）1989 年，韦克斯勒学前和小学儿童智力量表（WPPSI-R）1991 年，韦克斯勒儿童智力量表第三版（WISC- ）韦氏测验的特点：（1）1012 个分测验：使用多个分测验，不仅可以得到总 IQ，还可以分析个体在智力上的强项和弱点；（2）言语量表和操作量表各由 56

45、个分测验组成，可以单独评价言语或操作的各项智力成分，体现了左右脑功能的整合，而且可以显示个体的职业能力倾向。（3）共同的 IQ 计分系统：对所有测验和所有年龄组， IQ 平均为 100，标准差为 15。而且每个分测验的平均分为 10，标准差接近 3 分。这样就可以比较被试的各项分测验分数，了解其相对强弱。（4）不同年龄组有相同的分测验：例如，WAIS-R，WISC-R ，WPPSI-R 有相同的 8 个核心分测验。这不仅方便施测者，而且有助于测验之间的相互比较。韦克斯勒测验的分测验（1）常识(information)33 个一般知识性问题，如“谁发现了美洲？”“我国的首都在哪里？ ” “儿童

46、节是哪一天？”得分越高，说明兴趣越广泛，好奇心强，长时记忆好。把该测验放在首位，容易与被试建立关系，不易引起被试的紧张和厌烦。（2）数字广度(digit span)分顺背和倒背两部分（2 位到 9 位数）。主要测查瞬时记忆能力。对智力低者，测其智力；对智力高者，测其注意力。按 0 或 1 计分，总分为两部分之和。智力高者在该项上得分未必高，有时倒背可能会高于顺背成绩。脑功能障碍者一般得分较低。但对有些白痴学者，能轻易得高分。（3）词汇(vocabulary)要求被试定义和解释通过视觉或听觉呈现给他们的字词的一般意义。例如“什么是杯子？”“什么是美丽？”该测验与抽象概括能力有关。年龄大的、智力

47、高的、受教育程度高的、经历丰富的人，其得分高。问题是计分困难。答案分四级：一级：用同义词，且能说明二者的细微差别；二级：具体运用词汇来造句；三级：望文生义，作字面解释；四级：做手势或指实物给主试看。一级计 2 分，二级计 1 分，三四级计 0 分。（4）算术(arithmetic)简单项目主要是加减法运算。难一些的问题需要对问题进行分析，并运用两种以上的算术运算。主要测量基本的数理知识和数学思维、推理能力。（5）理解（comprehension）容易的题目主要测常识，如“为什么人要穿衣服？”难的项目需要了解社会、文化传统，如“为什么最高法院任命终身法官？”该分测验能反映被试对于社会价值取向、风

48、俗、伦理道德是否理解和适应，在临床上可以鉴别脑器质性障碍的病人。（6）类同（similarities）让被试区分物体、事实和观念的重要的相似性与不重要的相似性，如“衬衫和袜子有什么相似的地方？”测查个体的逻辑思维、抽象思维、分析和概括能力。（7）填图（picture completion）要求被试回答图中缺少了什么重要成分。主要测的是记忆、细节注意能力和视觉敏锐性。具有病态观念的患者往往将自己的思想投射到测验中去。智力落后者的填图成绩很差。（13）句子（sentences）要求被试逐字重复主试大声读出的句子。测查注意和记忆能力。（14）几何图形（geometric design）10 个图案，每个图形由一个圆、一个正方形和一个菱形组成，让儿童复写。（15）动物房（an

展开阅读全文