1、第五章 心理测量学知识,第一节 概 述,第一单元 测量与测量量表,一、什么是测量 测量就是依据一定的法则用数字对事物加以确定。 定义中包括三个主要的元素:(1)事物(测量对象) (2)数字 (测量结果)(3)法则(测量工具 二、测量要素 任何测量都应该具备两个要素:既参照点和单位。 参照点有两种:a.绝对零点 b.相对零点 心理测验质量要求:信度、效度、难度、区分度三、测量量表 命名量表 顺序量表 等距量表 等比量表,命名量表,命名量表,(概念辨析:心理测验(名词)、心理测量(动词)、心理测试、心理评估),心理评估:应用多种方法所获得的信息,对个体某一心理现象作全面、 系统和深入的客观描述,这
2、一过程称为心理评估(psychological assessment)。 主要有观察、调查、心理测验(psychological test)和实验等。,第二单元 心理测验的基本概念,教材(基础知识)P327328 一、心理测验的定义 所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。 二、心理测验的性质 (一)间接性 (二)相对性 (三)客观性,第三单元 心理测验的分类(1),教材(基础知识)P328330 心理测验与心理测量的区别: 心理测验是一种工具;心理测量是一个过程 一、按测验
3、功能分类: a.智力测验 b.特殊能力测验 c.人格测验 二、按测验的材料分类: a.文字测验 b.操作测验 三、按测验材料的严谨程度分类: a.客观测验 b.投射测验,投射测验,1概念:投射法是指向被试者提供一些未经组织的刺激 情境,让他在不受限制的情境下,自由地表现出他的反应,分析反应的结果,便可推断出他的人格结构。 2投射技术的种类 (1)联想法 (2)构造法 (3)表露法 (4)完成法,罗夏墨迹测验联想法,主题统觉测验构造法,句子填充测验完成法,我最喜欢 。 我最讨厌 。,逆境对话测验完成法,表露法,主要有: a.画人测验 b.知觉运动测验,第三单元 心理测验的分类(2),四、按测验的
4、方式分类: a.个别测验 b. 团体测验 五、按测验的要求分类: 最高行为测验成就测验、学绩测验 典型行为测验一般人格等。,第四单元 如何看待心理测验,教材(基础知识)P330331 一、错误的测验观 (一)测验万能论 (二)测验无用论 二、正确的测验观 (一)心理测验是重要的心理学研究方法之一、是决策的辅助工具 (二)心理测验作为研究方法和测量工具尚不完善。,第五单元 心理测验在心理咨询中 的应用,教材(基础知识)P331332 在我国目前情况下,心理门诊中运用较多的大致有这样3类心理测验: 一、智力测验 (比纳(中国)、韦氏、瑞文推理、WDIII)二、人格测验 (MMPI、16PF、EPQ
5、)三、心理评定量表(SCL-90、抑郁自评量表(SDS)、焦虑自评量表(SAS)-自评;,他评: 汉密尔顿抑郁量表(HAMD) 简明精神病评定量表(BPRS) 倍克-拉范森躁狂量表 (BRMS) 应激与相关问题评估 生活事件量表 (LES) 社会支持评定量表 应对方式问卷 儿童行为量表,第六单元 心理测验的发展史(1),教材(基础知识)P332335 一、科学心理测验的产生与发展 三个重要人物: a.高尔登(F.Galton),首先倡导科学心理测验的学者 b.卡特尔(J.M.Cattell),卡特尔在心理杂志上发表“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中 c.比内(A.Bi
6、net),编写了世界上第一个正式的心理测验,第六单元 心理测验的发展史(2),20世纪心理测验的主要发展: 1、操作测验的发展 2、团体智力测验的发展 3、能力倾向测验的发展 4、人格测验的发展 二、我国古代心理测验思想 1、先秦时期的心理测验思想 孔子的差异心理思想 孟子的万物皆可测量的思想 2、科举考试对心理测验的影响,古代对心理测验的尝试 杨雄与词汇测验 刘劭与人物志 智力玩具与智力测验 二、我国近代心理测验的产生与发展 1、我国最早的心理测验 1914年广东 2、比内-西蒙测验的介绍 1916年报告 樊炳清 3、小学生毛笔书法量表的编制 1918年俞子夷 4、测验课程的开设 1919年
7、报告 廖世承 5、第一本心理测验专著智力测验法 1921 年,廖世承 6、麦考试尔来华讲学班 1922 7、大规模教育调查 1923年 8、第一次修订比内测验 1924年 9、中国测验学会成立 1931年 10测验 杂志创刊 1932年 11、第二次修定比内量表 1936,我国现代心理测量发展,1、禁区开始被打破常 1979 2、心理测量学习班与心理测验协作组成成立 1979年在长沙 龚耀先医学卫生系统 1980年在武汉 林传鼎 张厚璨 师范院校 3、大量国外量表被修订 1982年龚耀先修订韦氏成人智力量表 1982,第二节 测验的常模,第二节 测验的常模补充内容:常模参照分数与标准参照分数,
8、常模参照分数解释的测验:律师考试就是这样,即使大家考试都考得特别好,也只要前面的百分之几。根据大家的成绩。 标准参照分数解释的测验:国家心理咨询师的考试,出了两份卷子:基础理论,操作技能,满分一百,及格六十。两科都满60,可以得到分数。门槛已经设好了。大家都能跳过门槛,就都能通过。很多人都没有通过,也就不能过去了。通过与不通过,参照一个事先设定好的标准,来解释分数。叫做标准参照分数解释。,第一单元 常模团体(1),教材(基础知识)P335338 一、常模团体的性质 常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以提供比较的基础。
9、任何一个测验都有许多可能的常模团体 对测验编制者而言,常模的选择包括:确定一般总体、确定目标总体、确定样本。 对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。,第一单元 常模团体(2),二、常模团体的条件 (一)群体的构成必须明确界定 (二)常模团体必须是所测群体的代表性样本 (三)样本的大小要适当 总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。 (四)标准化样组是一定时空的产物,第一单元 常模团体(3),三、取样的方法 简单随机抽样 系统抽样 分组抽样 分层抽样 四、常
10、模分数与解释 常模分数:常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。 常模:常模分数构成的分布,就是通常所说的常模(norm),它是解释心理测验分数的基础。,第二单元 常模的类型(1),教材(基础知识)P339344 一、发展常模(年龄量表) (一)发展顺序量表 最早的一个范例是葛塞尔发展程序表 (二)智力年龄 比内-西蒙量表中首先使用智力年龄的概念。 计算方法:假如某儿童6岁组的题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁)+42(月)+32(月)+22(月)=6岁+18月=7岁6个月。 (三)年级当量 年级当量实际上就是
11、年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。,第二单元 常模的类型(2),二、百分位常模 (一)百分等级 指在常模样本中低于这个分数的人数的百分比。 (二) 百分点 也称百分位数。计算处于某一百分比例的人对应的测验分数是多少。 (三)四分位数和十分位数 四分位数和十分位数只是百分位数的两个变式,其含义相似。,第二单元 常模的类型(3),三、标准分数常模 标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。 1.线性转换的标准分数 Z=(X-X)/SD Z=A+BZ 2.非线性转换的标准分数 当原始分数不是常态分布时,也可
12、以使之常态化,这一转换过程就是非线性的。,第二单元 常模的类型(3),四、智商及其意义 1.比率智商 IQ=MA/CA*100 2.离差智商 IQ=100+15Z=100+15(X-X)/SD 必须指出:从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。(参见本课程教学参考资料:专栏5-2几种导出分数间的相互关系),注意的问题,发展常模换算及解释时需要注意的问题 只适合于所测特质随年龄发展变化的情况,对成年人不适用,只适用于在典型环境下成长的儿童。一年的差异在不同年龄有不同的含义。 百分位换算及解释时需要注意的问题 顺序量表,缺少相等单位。靠近中央的
13、原始分数差异扩大,而两端的差异缩减。不能比较和说明不同被试间分数差异的数量。 标准分数换算及解释时需要注意的问题 计算非线性转换的标准分数时,特质的分数实际上应该是常态分布。标准差不同,其分数的意义不同。,第三单元 常模分数的表示方法,教材(基础知识)P345347 一、转换表法 最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。 二、剖面图法 剖面图就是将测验分数的转换关系用图形表示出来。,第三节 测验的信度,第一单元 信度的概念,教材(基础知识)P348349 一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。 二、信度
14、的指标 1.信度系数与信度指数 大部分情况下,信度是以信度系数为指标,它是一种相关系数。 2.测量标准误,第二单元 信度评估的方法(1),一、重测信度 又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。 二、复本信度 又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。 三、内部一致性信度 a.分半信度 b.同质性信度 四、评分者信度,第二单元 信度评估的方法(2),教材(基础知识)P349351 一、重测信度 又称稳定性系数。它的计算方法是采用重测法,即使用
15、同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。 一般是两周到四周较宜,间隔时间最好不超过六个月。 二、复本信度 又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。 复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。,第二单元 信度评估的方法(3),三、内部一致性信度 a.分半信度:分半信度指采用分半法估计所得的信度系数。 修正公式是斯皮尔曼-布朗公式: b.同质性信度:
16、同质性主要代表测验内部所有题目间的一致性。 几个计算同质性信度的公式如下: 1库德-理查逊公式 2克伦巴赫系数 四、评分者信度 用于测量不同评分者之间所产生的误差。,第三单元 信度与测验分数的解释(1),教材(基础知识)P352353 一、解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。 二、确定信度可以接受的水平 当rxx .70时,测验不能用于对个人作出评价或预测,而且不能做团体比较;当.70 rxx .85时,可用于团体比较;当rxx .85时,才能用来鉴别或预测个人成就或作为。,第三单元 信度
17、与测验分数的解释(2),三、解释个人分数的意义 作用:其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。 例:在一个智力测验中,某个被试的iQ为100,这是否反映了他的真实水平?如果再测一次,他的分数将改变多少? X1.96SEXTX+1.96SE 已知该智力测验的标准差为15,信度系数为.84,则其iq的测量标准误和可能范围为: SE= IQ=1001.96610011.7688112,四、比较不同测验分数的差异 例;某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0
18、.87和0.88。问其操作智商是否显著高于言语智商呢? 首先计算出差异分数的标准误: 在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此,将差异标准误(7.5)乘以1.96,结果为14.7,这表明个体在韦氏测验两半得分的差异高于大约15分,才能达到0.05显著水平。上述被试的差异分数110-102=8是不显著的。,第三单元 信度与测验分数的解释(3),第三单元 信度与测验分数的解释(4),三、解释个人分数的意义 一般采用95%的或然水平,其置信区间为: X1.96SEXTX+1.96SE 四、比较不同测验分数的差异,第四单元 影响信度的因素,教材(基础知识
19、)P354355 一、样本特征 (一)样本团体异质性的影响 (二)样本团体平均能力水平的影响 二、测验长度 (一)测验越长测题取样或内容取样越有代表性 (二)测验越长被试的猜测因素影响就越小。 三、测验难度 洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;是非题,0.85。 四、时间间隔 两次测验相隔时间越短,其信度系数越大(参见本课程教学参考资料:专栏5-3信度的特殊问题),注意事项,斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以采用弗朗那根
20、(Flanagan)公式或卢伦(kulon)公式之一,直接求得测验的信度系数。 对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验。,第四节 测验的效度,第一单元 效度的概念,教材(基础知识)P357358 一、效度的定义 在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。 二、效度的性质 1.效度具有相对性 任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。 2.效度具有连续性 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的
21、区别。效度是针对测验结果的。(参见本课程教学参考资料:专栏5-4信度和效度的关系),第二单元 效度评估的方法(1),教材(基础知识)P359364 一、内容效度(content-related validity) 什么是内容效度 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。 内容效度的评估方法 1专家判断法 2统计分析法 3经验推测法 内容效度的特性 内容效度经常与表面效度(face validity)混淆。表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;内容效度是由够
22、资格的判断者(专家)详尽地、系统地对测验作评价而建立的。,第二单元 效度评估的方法(2),二、构想效度(construct-related validity) 什么是构想效度 指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。 构想效度的估计方法 1对测验本身的分析 2测验间的相互比较:相容效度、区分效度、因素分析法 3效标效度的研究证明 4实验法和观察法证实,第二单元 效度评估的方法(3),三、效标效度(criterion-related validity) 什么是效标效度 效标效度又称实证效度,反映的是测验预测个体在某种情境下
23、行为表现的有效性程度。 根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。 一个好的效标必须具备以下条件: 效标必须能最有效地反映测验的目标,即效标测量本身必须有效; 效标必须具有较高的信度,稳定可靠,不随时间等因素而变化; 效标可以客观地加以测量,可用数据或等级来表示; 效标测量的方法简单,省时省力,经济实用。,第二单元 效度评估的方法(4),效标效度的评估方法 1相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。 2区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。 3命中率法 命中率法是当测验用来
24、做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。,第三单元 效度的功能,教材(基础知识)P365366 一、预测误差 效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。 二、预测效标分数 如果X与Y两变量呈直线相关,只要确定出二者间的回归方程,就可以从一个变量推估出另一个变量。 三、预测效率指数 E=100(1-K),第四单元 影响效度的因素,教材(基础知识)P366368 一、测验本身的因素 测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。 二、测验实施中的干扰因素 主试的影响因素 被试的
25、影响因素 三、样本团体的性质 样本团体的异质性 干涉变量 四、效标的性质,第五节 项目分析,第一单元 项目的难度,教材(基础知识)P368370 一、定义 难度(difficulty),顾名思义,是指项目的难易程度。 二、计算方法 二分法记分的项目 非二分记分的项目 三、难度水平的确定 项目的难度 :P值越接近于0.50,区别力越高。 测验的难度,第二单元 项目的区分度,教材(基础知识)P370372 一、定义 项目区分度(item discrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。 二、计算方法 鉴别指数 相关法 1点二列相关 2二列相关 3相关法 三、区分
26、度与难度的关系,第六节 测验编制 的一般程序,第一单元 测验的目标分析,教材(基础知识)P373375 一、测验的对象 二、测验的用途 显示性测验:指测验题目和所要测量的心理特征相似的测 验。 预测性测验:指预测一些没被测量的行为的测验。 三、测验的目标 工作分析 对特定概念下定义 确定测验的具体内容,第二单元 测题的编写(1),教材(基础知识)P375378 一、搜集资料 已出版的标准测验 理论和专家的经验 临床观察和记录 二、命题原则 内容方面 文字方面 理解方面 社会敏感性方面,第二单元 测题的编写(2),三、编制要领 1.选择题(注意事项) a题干所提的问题必须明确,尽量使用简单而且明
27、晰的词语。 b选项切忌冗长 c.每题只给一个正确答案,其它属诱答。 d.各选项长度应相等 e避免题干用词与选项用词一致 f选项最好用同一形式 2.是非题 是非题又叫正误题,是指出一个论点要被试判断是否正确,或是从是非两个答案做出选择,因此可以把是非题看作是两个备选答案的选择题。,第二单元 测题的编写(3),3.简答题 在客观测验试题中,只有简答题是提供型题目,它要求被试用一个正确的词或句子来完成或填充一个未完成句子的空白,或者是提供一个正确的答案。有时将前者称之为填充题,后者称之为简答题。 4.操作题 操作题是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验,是让被试实际操作,如
28、画图、走迷津、拼配物体等,可作为纸笔测验题的补充。,第三单元 测验的编排和组织(1),教材(基础知识)P378382 一、合成测验 选择与审定试题 1.选择试题形式 2.审定题目 测题的编排 二、测验的预试 预测 项目分析 三、信度和效度考察 信度 效度 四、常模制订,第三单元 测验的编排和组织(2),五、编写指导手册 测验指导手册的内容有: 1测验的目的和功用。 2测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的,许多手册还提供选择题目的统计指标。 3如何实施测验的说明。 4测验的标准答案和记分标准。 5常模资料,包括常模表、常模适用的团体及对测验分数如何做解释。 6
29、测验的基本特征,包括难度、鉴别力、信度、效度和因素分析的资料,以及这些资料取得的条件和情境,包括调查的样本和时间。,第七节 心理测验的使用,第一单元 主试的资格,教材(基础知识)P382383 一、知识结构 二、专业理论知识和专业技能 专业理论知识 专业技能 三、职业道德 测验的保密和控制使用 测验中个人隐私的保护 第二单元 测验的选择 一、所选测验必须适合测量的目的 二、所选测验必须符合心理测量学的要求,第三单元 测验前的准备及注意事项,教材(基础知识)P384385 一、测验前的准备工作 预告测验 准备测验材料 熟悉测验指导语 熟悉测验的具体程序 二、测验中主试的职责 三、建立协调关系 协
30、调关系(rapport)是一个专业术语,在临床心理咨询、心理治疗中经常用到。,第四单元 测验实施的程序及要素,教材(基础知识)P385386 一、指导语 对被试的指导语 对主试的指导语 二、时限 大多数典型行为测验是不受时间限制的,在速度测验中,尤其要注意时间限制,不得随意延长或缩短。 三、测验的环境条件 标准化的实施程序不仅包括口述指导语、计时、安排测验材料以及测验本身的一些方面,同时还包括测验的环境条件。,第五单元 被试误差及控制方法,教材(基础知识)P386389 一、应试技巧与练习效应 应试技巧 被试对测验的经验或应试技巧会影响测验成绩,对测验的程序和技能熟悉程度不同,所得分数便不能直
31、接比较。 练习效应 二、动机与焦虑因素 应试动机 测验焦虑 三、反应定势 求“快”与求“精确”的反应定势 2.喜好正面叙述的反应定势 3.喜好特殊位置的反应定势 4.喜好较长选项的反应定势 5.猜测的反应定势,第六单元 测验的评分,教材(基础知识)P339344 一、原始分数的获得 三点要求 : 1及时而清楚地记录反应情况。 2要有一张标准答案或正确反应的表格,即记分键。 3将被试的反应和记分键比较,对反应进行分类。 二、原始分数的转换,第七单元 测验结果的报告 (1),教材(基础知识)P390392 一、测验分数的综合分析 应根据心理测验的特点进行分析 不能把分数绝对化 1将个人在测验前的经历考虑在内 2测验情境也是一个需要考虑的因素 必须有测验的信度和效度资料 对于来自不同测验的分数不能直接加以比较,第七单元 测验结果的报告 (2),二、报告分数的具体建议 不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议 避免使用专业术语 要保证当事人知道这个测验测量或预测什么 要使当事人知道他是和什么团体在进行比较 要使当事人知道如何运用他的分数 要考虑测验分数将给当事人带来什么心理影响 要让当事人积极参与测验分数的解释,