收藏 分享(赏)

王建心理测量学知识(咨询师).ppt

上传人:jinchen 文档编号:4670099 上传时间:2019-01-07 格式:PPT 页数:136 大小:251.50KB
下载 相关 举报
王建心理测量学知识(咨询师).ppt_第1页
第1页 / 共136页
王建心理测量学知识(咨询师).ppt_第2页
第2页 / 共136页
王建心理测量学知识(咨询师).ppt_第3页
第3页 / 共136页
王建心理测量学知识(咨询师).ppt_第4页
第4页 / 共136页
王建心理测量学知识(咨询师).ppt_第5页
第5页 / 共136页
点击查看更多>>
资源描述

1、心理测量学,心理学的重要研究方法之一,第一节 概述,一、测量的基本概念 (一)测量的定义测量:依据一定的法则,使用量具对事物的特征进行定量描述的过程。,一定的法则 事物的特征 量具 定量描述,(二)测量的基本要素,1、 参照点绝对参照点(绝对零点)相对参照点2 、单位好的单位须符合两个条件: 意义明确:同一单位对所有人来说意义相同。 等价:第一单位与第二单位之间的距离第二单位与第三单位之间的距离。,(三)测量的量表,量表(scale):使事物的特征数量化的数字的连续体。 Stevens:将量表从低到高分为4个等级。 1 、命名量表(Nominal Scale) 2 、 顺序量表(Order S

2、cale) 3 、等距量表(Interval Scale) 4 、比率量表(Ratio Scale),1 、命名量表(Nominal Scale)用数字来代表事物或对事物进行分类。代号类别数字只是一种名称的替代物。不同的个体用不同的数字标志。如球员的号码,各种分类标志(男或女;正常或异常,等),2 、 顺序量表(Order Scale)给个体赋值,使数值的大小次序与个体在所测量的心理特性上的多少、大小、高低等的次序相符合。顺序量表在心理和教育中十分常见(如竞赛成绩排名等)。,3 、等距量表(Interval Scale)给个体赋值,使数值间的差不仅能够反映出对应个体在所测量心理特性上的排序,而

3、且能够反映出对应个体在该特性上的差异程度。(如温度计,偏爱程度等)但建构间距量表不是容易的事,常常只能做到顺序量表。,4 、比率量表(Ratio Scale)给个体赋值,使数值间的比率能够反映对应个体在测量心理特性上比率。(如身高、体重、速度等)。但在心理学中是极少见的。心理测量通常都是顺序量表,为方便比较,通常把顺序量表转换为等距量表。,二、 心理测验的基本概念,(一)定义 心理测验:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。,1、心理心理测验测量的是人的行为 2、行为样本:从总体行为中抽取出

4、来的、能够反映个人特定心理特质的一组行为,作为直接的测量对象。 3、测验条件对所有被试必须是相同的。 4、原始分数的解释只有与其他人的分数或常模比较才有意义。,(二)心理测量的性质,1 心理测验的间接性通过测量外显行为来推断内隐的心理特质2 心理测验的相对性没有绝对的标准3 心理测验的客观性测验的客观性实际上就是测验的标准化问题,三 心理测验的种类,一、心理测验的种类 (一)按测验的功能分类 1能力测验智力测验、特殊能力测验、能力倾向测验 2学绩测验已获得的学业成就 3人格测验兴趣、态度、动机、气质、性格,(二)按测验的方式分类 1个别测验 优点:获得的信息多;容易建立融洽的合作关系;特殊被试

5、(幼儿、盲人) 缺点:费时、复杂、对主试要求高。2团体测验 优点: 缺点:,(三)按测验材料性质分类 1文字(纸笔)测验 2非文字(操作)测验文化公平测验(四)按测验材料的严谨程度分类 1构造性测验 2投射性测验,(五)按测验的要求分类 1最高行为测验 2典型行为测验,四、对心理测验的科学态度,(一)错误观念1、万能论2、无用论3、心理测验就是智力测验(心理测验 = 智力测验 = 智商 = 遗传决定论),(二)对待测验的正确态度 1、 心理测验是研究心理学的重要方法之一,是决策的辅助工具; 2、心理测验作为研究方法和测量工具尚不完善; 3、防止乱编和滥用心理测验。,第二节 测验的常模,一、常模

6、团体 (一)常模团体的性质由具有共同特征的人所组成的一组群体,或是该群体的一个样本。任何一个测验,都有许多可能的常模团体。在制定常模时,首先要确定常模团体。在对常模参照分数做解释时,也必须首先考虑常模团体的组成。,二、确定常模团体的注意事项,常模团体的四个条件: 1、 群体构成的界限必须明确对每个常模团体的性质和特征的简短且明确的描述。 2、 常模团体必须是所测群体的代表性样本 克服取样偏差,采用正确的取样方法:随机取样,系统抽样,分层取样。,3、样本大小要适当从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。 样本大小可以根据以下几方面来确定:常模总体的数目。总体

7、数目小,则样本数目也小;总体数目大,样本数目也应大。一般来说,样本最好应有30100人;如果是全国性常模,一般应有20003000人为宜。总体性质。总体性质越复杂,样本容量就越大。测验结果的精确度。精确度要求越高,样本量就越大。,4 、常模团体必须是近时的。,三、取样的方法,取样:从目标人群中选择有代表性的样本上。 统计学分类:随机抽样、非随机抽样 随机原则:从总体中取样时,每个个案被抽取的机会是均等的。,1、简单随机抽样 按随机表顺序抽样。 每个人或抽样单位有相同的机会成为常模中的一部分。,2、系统抽样是介于随机抽样和和非随机抽样之间的一种抽样方法。其第一种样本可以依立意抽样法抽取;亦可用随

8、机方式抽取。 具体抽样流程为: 抽样前,须将母体的每一个单位编号,先计算样本区间(即N/n,N表示母体的数目,n表示样本的大小),如果样本区间为分数,可四舍五入化为整数。然后从1到N/n号中随机抽出一个号码作为第一个样本单位,将第一个样本单位的号码加下样本区间即得第二个样本单位,依此类推,直到样本数抽够为止。,3、分组抽样先将总体依照一种或几种特征分为几个子总体(类群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本比如某中学有1000名学生装,其中男600人,女有400人,欲采用分层抽样从中抽取100人的一个样本,则其中男应有60人,女应

9、有40人样本的精确度还与分层数目及样本大小密切相关,分层越细,样本越大,则样本的代表性越好。,4、分层抽样 是将总体按照某种标准(年龄、文化程度)划分为一些子群体。每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。,四、常模分数与常模,1、常模分数:对常模样本施测后,将被试的原始分数按一定规则转换出来的导出分数。 2、常模 常模分数构成的分布是。它是解释心理测验分数的基础。 种类:一般常模、特殊常模 常模分数和常模均会随时间的变化而改变,因此常模必须经常修订。,五、常模的类型,类型: 1、发展量表 2、商数 3、百分位 4、标准分数,(一)发展量

10、表,1心理年龄(mental age)(智力年龄)指被试智力发展水平的年龄。单位是年(或岁)和12个等距的月。年龄量表最基本的假设是,随年龄的增长,所测量的特质有系统的改变。因此,不适用于成人。,年龄量表的基本要素: (1)题目:可区分不同年龄组; (2)常模团体:由各个年龄被试组成的有代表性样本; (3)常模表,2年级当量(grade equivalents),即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。年级常模的单位通常为10个月间隔。如5年级的分布为5-0到5-9。年级当量只适用于一般课程,不适合只学12年的课程。年级当量只适用于解释

11、本学年的水平,不适用于跨学年的。如一个五年级学生的年级当量为8,并不能说他已经掌握了8年级的课程。,3. 发展顺序量表(ordinal scales),格塞尔发展顺序量表 格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。,皮亚杰量表 用特定的任务来揭示儿童发展处于哪个阶段。 5岁:质量守恒 6岁:重量守恒 7岁:容量守恒,(二)商数(quotient),1比率智商IQ=100(MA/CA) 缺点:实龄是等距的,而智龄不等距(智力发展不是直线的)计算成人智商时,以多大实龄作为除数?智力生长何时达到顶点

12、?不同年龄组,比率智商分数具有不同的标准差,因而相同的比率智商对于不同年龄具有不同的意义。 2、离差智商:IQ100+15Z,(三)百分位,1、 百分等级(percentile rank)概念:某个分数的百分等级就是得分低于这个分数的人数的百分比。 百分等级指示个体在常模团体中的相对位置。 百分等级越低,个体所处的地位越低。,2 百分点相对于某一百分等级的分数点叫百分点或百分位数。3 十分位 百分点将分数分布分成100个等份。 十分位是将分数分成10个等份。十分位提供一个10级的等级量表,每一级包括10%的分数。,百分位的评价 优点:(1)容易计算,容易解释。(2)对于各种被试和各种测验普遍适

13、用。 缺点:(1)缺少相等单位,属于顺序量表,不能做加减乘除运算。(2)分布与分数分布不一致,(四)标准分数(standard score) 1 Z分数。X - XZ=S不仅具有可比性,还具有可加性。Z = 0 SZ = 1,-3 +3 约占总体的99.73%。,除了Z分数外,还可以把Z分数转换成T分数、标准九、离差智商等。 转换方法:线性转换:从正态到正态非线性转换:从偏态到正态(通过百分等级),2 T分数(非线性转换,常态化)纪念Terman和Thorndike。T=10Z+50平均数为50,标准差为10,3 标准九(stanine)标准化九级分制标准九=5+2Z,即平均数为5,标准差为2

14、,4 离差智商(deviation IQ)IQ = 100 + 15Z,六、常模分数的表示方法,(一)转化表 转化表的3个基本要素:原始分、导出分、常模团体的特征描述。 1简单转化表2复杂转化表,(二)剖析图,第三节 测验的信度,测量误差及其来源 一、测量误差的含义: 测量值与实际值的差异 二、测量误差的种类 系统误差:测量工具本身引起的误差(稳定); 随机误差:由不稳定因素引起的误差(不稳定)。,真分数及其有关的假设,真分数(True Score):一个测量工具在没有测量误差时,所得到的纯正值。 操作定义:无数次测量结果的平均值。观察分数(Observed Score):测验分数,真分数的数

15、学模型及其假设X = T + E X:测验分数 T:真分数 E:误差测量误差的假设:(X)= T 或 (E)= 0,SX2 = ST2 + SE2 实得分数的变异数真分数的变异数误差变异数(随机误差) ST2 = SV2 + SI2 真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数(系统误差) SX2 = SV2 + SI2 + SE2,SX2,ST2,一信度概述,(一)什么是信度? 信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。 操作定义:一组测量分数的真变异数与总变异数(实得变异数)的比率。rxx=ST2 / Sx2rxx:信度系数,注意: (1)信度

16、指的是一组测验分数或一系列测量的特性,而不是个人分数的特性; (2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。,(二)信度的作用 1评价测验:信度是测量过程中所存在的随机误差大小的反映2解释个人测验分数的意义SE=SX1 - Rxx SE:标准误 Sx:所得分数的标准差 rxx:测验的信度真分数的置信区间(95%)=X1.96SE3不同测验分数的比较,二 信度的估计方法,(一)重测信度 1含义和计算 重测信度(test-retest reliability):用同一量表对同一组被试施测两次所得结果的一致性程度。,rxx=,X1X2/N-X1X

17、2,S1S2,2使用的前提条件 所测量的心理特质必须是稳定的;练习和遗忘的效果基本上相互抵消;在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。,(二)复本信度,1含义和计算复本信度(Alternate-form reliability)是指两个平行(等值)的测验测量同一批被试所得结果的一致性程度。计算方法与重测法相同。,施测的安排: 等值性系数:两个复本测验是同时连续施测的稳定等值系数(重测复本信度):两个复本测验是相距一段时间分两次施测的。,2使用的前提条件 两测验真正平行:项目的内容、形式、数量、难易、时限、指导语等 被试要有条件接受两个测验。注意:时间间隔要

18、适当。,3、局限 只能减少而不能排除练习和记忆的影响。 许多测验建立复本相当困难。,(三)分半信度,1含义和计算 分半信度(split-half reliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。 假设:两半测验等值。,常见的分半方法是按测题序号奇偶分半: l 测验题目按某种顺序(如难度)排列; l 如果是随机排列的题目,则必须是所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的); l 如果测验有多个分量表,应在分量表内部排好顺序,再把各分量表的两半组合起来求相关。,奇偶分半法作用注意事项,如果有相互有牵连的项目或一组解决同一问题

19、的项目时,这些项目要放在同一半中。 如果试卷中存在任选题或试卷为速度测验时,不宜使用分办信度。,分半法是按正常的程序实施测验,然后将全部项目分成相等的两半,根据各人在这两半测验的分数计算其相关。然后进行修正(?) 校正公式:斯皮尔曼-布郎公式rxx= 2 rhh /(1+ rhh) rhh是两半测验分数之间的相关系数。,当假定“两半测验等值(具有相同的平均数和标准差”)不成立时,用弗朗那根公式或卢仑公式来估计信度。 弗朗那根公式:rxx = 2 1 -(Sa2 + Sb2)/ Sx2Sa2 、 Sb2是两半测验分数的变异数,Sx2是测验总分的变异数,卢仑公式:rxx = 1 - Sd2 / S

20、x2 Sd2 :两半测验分数之差的变异数 Sx2:测验总分的变异数,(四)同质性信度 1含义 同质性信度(homogeneity reliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。可弥补分半法的不足。2计算及适用范围 基本公式: rkk = K rij / 1 +(K - 1)rij K为测验项目数 r ij是项目间相关系数的平均数。,库德理查逊公式KR20公式:rxx = K /(K - 1) 1-(piqi)/ Sx2 pi为答对第i题的人数的比例;qi为答错第i题的人数的比例;K为题目数, Sx2为测验总分的变异。 适用于:已知各项目的难度,(五)评分者信

21、度 1含义和计算 评分者信度(scorer reliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。2人时:相关系数(积差相关) .90 多人时:肯德尔和谐系数 W=12 R i2 -(R i)2 / N / K2(N3 -N) (K=3 20;N=3 7时,查W表检验)R I为第i个被试被评的水平等级之和,七、影响测量信度的主要因素,(一)被试方面 被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。 被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。(二)主试方面指导语、态度、期望等 (三)施测情境,(四)测量工具 测验长度:测验越长,信度越高

22、。 测验难度:过难或过易都会使个体间得分差异减小,降低信度。测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。 (五)两次施测的间隔时间 间隔时间越短,信度越高; 间隔时间越长,信度越低。,第四节 测验的效度,一效度的概念 1、什么是效度 效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。 (1)效度是一个相对的概念:每个测量工具都有自己的目的;内隐特质是通过外显行为间接测得的。 (2)效度是测量的随机误差和系统误差的综合反映。 (3)判断一个测量是否有效要从多方面收集证据,操作定义: 效度=SV2/SX2=rXY2,SX2,ST2,实得分数的变异数真分数的

23、变异数误差变异数(随机误差) 真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数(系统误差),2、效度与信度的关系 (1)信度高是效度高的必要而非充分条件 一个测验效度高,其信度也必然高; 但一个测验信度高,其效度不一定高。(2)测验的效度受它的信度制约rXYrXX 一个测验的信度必然比效度高,至少相等。,二、 效度的估计,1、内容效度 内容效度(content validity)是指测验题目对有关内容或行为取样的适当程度,即一个测验实际测到的内容与所要测量的内容之间的吻合程度。 一个测验要有内容效度必须具备两个条件: (1)要有定义完好的内容范围 (2)测验题目应是所界定的内容范围的

24、代表性取样。,应用范围:主要应用于成就测验,也适合于某些用于选拔和分类的职业测验。不适用于能力倾向测验和人格测验。表面效度(surface validity):外行人对某个测验从表面上看好像是测某种心理特质的程度。并不是一种真正的效度。 人格测验要求表面效度不宜过高。,2内容效度的确定方法,(1)逻辑分析法:专家根据自己的知识经验对量表的有效性(逻辑性)作出判断,也称逻辑效度。为使内容效度的判断过程更客观,一般采用下列步骤: 确定测验内容的总体范围; 编制双向细目表; 编制评定量表,从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面,对测验作出

25、总的评价。,(2)统计方法:用两个测验复本来测同一批被试,若相关高,则内容效度可能高,但若相关低,则说明必有一个测验缺乏内容效度。(3)经验推测法 通过实践来检验效度,2、结构效度,structure validity是指一个测验实际测到所要测量的理论结构或特质的程度,或者说测验分数能够说明心理学理论的某种结构或特质的程度。特点: (1)具有不同理论构思的测验,其结构效度无法进行比较; (2)结构效度有时很难获得; (3)结构效度没有单一的指标,是由各方面的证据累积起来进行评价的。,结构效度的确定方法,结构效度确立的一般步骤: (1)提出理论框架; (2)依据理论框架推演出有关测验成绩的假设;

26、 (3)用逻辑或实证的方法来证明假设。,结构效度的确定方法,结构效度确立的一般步骤: (1)提出理论框架; (2)依据理论框架推演出有关测验成绩的假设; (3)用逻辑或实证的方法来证明假设。,具体方法: (1)测验内部寻找证据法 分析测验的内容效度:若内容效度高,说明其结构效度也高。 分析被试对题目反应的特点:有无社会称许性的题目,如“当事情不顺我意时,我时常动怒。”对该题的回答,也许反映不了要测的性格。 计算测验的同质性信度:分半信度、系数、KR20、KR21,(2)测验之间寻找证据法 相容效度:新老测验之间的相关(两测验测的是同一心理特质)。若相关高,则说明新测验可能有较高的效度。 区分效

27、度:新老测验之间的相关(两测验测的不是同一心理特质),若相关低,则说明新测验可能有较高的效度。 因素分析法:得出的因素符合理论的构思,说明效度高。,(3)考察测验的实证效度法 根据效标把被试分组,考察其得分差异。 根据测验得分差异把被试分组,考察其所测特质(行为表现)的差异。 (4)实验法和观察法证实 实验前训练实验后,3、实证效度,含义、种类及作用 实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。 效标(criterion) :被估计的行为是检验测验效度的标准。衡量一个测验是否有效的外在标准。 实证效度又称效标关联效度(criterion-related validity)

28、。,常用的效标: 学业成就 临床诊断 实际工作表现 特殊训练成绩 不同团体的总体表现 先前有效的测验 等级评定。,效标测量的条件,a.有效性:效标测量能真正反映观念效标。 b.可靠性:有较高的信度 c.客观性: 效标测量必须能真正反映观念效标,防止效标污染。 效标污染(criterion contamination)是指评定者知道被试的测验分数,因而影响到对效标的客观评定。 d.实用性: 经济实用,实证效度的确定方法,(1)相关法 测验分数与效标测量之间的相关系数。优点:数量化;可用回归方程进行个人效标预测 缺点:要求预测源与效标呈线性关系;无法提供关于取舍正确性的指标,(2)区分法 检验测验

29、分数能否有效地区分由效标所定义的团体。 T检验: 重叠量计算:,(3)命中率法 应用范围:预测源和效标都是二分的。,强调社会公平时使用,总命中率=(B+C)/(A+B+C+D) 当测验用于提高工作或学习效率时使用,正命中率= B/(A+B),效度的功能,一、预测误差 二预测效标分数 三预测效率指数,四、影响测量效度的因素,A测验的构成 项目的质量(题型、区分度、难易顺序) 项目数量 测验长度与效度的关系: r(nx)y =nrxy /n(1- rxx +nrxx)n测验增长倍数,B测验的实施过程C接受测验的被试 常模团体的同质性影响到对被试测验得分的解释,进而影响到测验的效度。 测验偏倚(te

30、st bias)是指用不适用于被试的标准来解释被试的测验得分,因而造成解释的偏差。,D效标 测量行为与所选效标的相似性越高,效度越高。 测验分数与效标行为之间是否是线性关系,如果不是线性关系,求皮尔逊相关就会低估效度。 效标本身的测量越可靠,效度就可能越高。E测量的信度,第五节 项目分析,项目分析:对项目进行筛选和修订,可以提高测验的信度和效度。定性分析:内容效度、题目编写的恰当性和有效性等的分析。 定量分析:主要是指题目难度和区分度的分析。,第一单元、 测验的难度,一、难度(difficulty)的含义 难度:指项目的难易程度。在“最高”作为测验(如:)中,称为“难度”,而在“典型”作为测验

31、(如:)中,则指“通俗性”。 两者都是指在总体中,能够正确或确切回答某项目的人数。,二难度的计算,1、二分法记分项目(是非题、选择题)的难度用通过率来表示。通过率(易度):P=R/NR:通过人数;N全体被试人数P越大,难度越小,用极端分组法(上下27%):被试较多时,测验总分从高到低排列。分别计算高分组和低分组在某一项目上的通过率,合并:P=(PH+PL)/2选择题难度的校正:CP(KP-1)/(K-1) CP:校正后通过率,P:实得通过率,K:备选答案数目,2、论述题等非二分法记分项目的难度P=X / Xmax X:所有被试在该项目上的平均得分, Xmax:该项目的满分。,三、难度水平的确定

32、,(一)项目难度:取决于测验的目的、性质和项目形式 1、测验目的:鉴别差异 防止被试得满分,满分的意义是不明确的。难度为0.50时最理想,项目具有最大的鉴别力。 一般只需使项目的平均难度接近0.50,各个项目的难度在0.50 0.20之间变化。 2、项目形式选择题的难度一般应大于猜测概率。是非题:0.75最合适;四选一:0.63 3、测验性质: 效标参照测验、掌握测验:不考虑难度 选拔测验:难度=录取率,(二)测验难度,取决于:测验各项目难度 考察测验分数的分布形态检验测验难度。正偏态,难度大常态分布,难度适中负偏态,难度低,标准参照测验、掌握测验:不考虑难度 允许分数分布是偏态的,第二单元

33、项目的区分度,一、区分度的含义 区分度(鉴别力):指测验项目对被试心理特性的区分能力。 项目的区分度是评价项目质量和筛选项目的主要指标。影响测验效度的重要因素。 高区分度项目能将不同水平的被试区分开来。 取值范围:-1+1,二、区分度的计算 项目得分高低、实际水平高低二者的相关。 1、鉴别指数 比较测验高分组和低分组的两组被试在项目通过率上的差别。D = PH - PL D值越大,区分度越高,项目越有效,伊贝尔(1965)鉴别指数评价标准,(二)相关法,相关法(项目-总分相关):以某一项目分数与效标分数或测验总分的相关作为该项目区分度的指标。 相关越高,区分度?,计算方法,1、点二列相关: 适

34、用于:一类变量是二分称名变量,另一类变量是连续变量 例如: 连续变量数据,如体重、身高以及许多测验与考试的分数; 二分称名变量数据,如性别(分男与女)、态度(分赞成和不赞成)、学习经历(分有与无)、考试结果(分合格与不合格)、题目解答(分答对与答错)等数据。,2、二列相关 适用于:两个连续变量,其中一个变量被人为分成两类。如: 一个测验的题目分数是连续的,而效标分数或测验总分被分成及格、不及格。 3、相关法 适用于:两个变量均为二分称名变量。,三、区分度与 难度的关系,项目难度以常态分布为好,平均难度0.50,第六节 测验编制的一般程序,一、测验的目标分析:对象、用途、目标 二、测题的编写 三

35、、测验的编排和组织,第一单元 测验的目标分析,一、测量的对象:测验适用的团体 年龄、性别、职业、受教育程度、经济状况、民族、文化背景等。 二、明确测量用途 用于显示,或用于预测? (一)显示性测验:测验题目和所要测量的心理特征相似的测验。 (二)预测性测验:预测一些没被测量的行为的测验。,三、测量目标 (一)工作分析:预测性测验中要对所预测的行为活动作具体分析。 确定哪些心理特征和行为可以使要预测的活动达到成功。 建立效标。成功的标准 (二)对特定概念下定义(操作定义):具体。 (三)确定测验具体内容:双向细目表,例:小学自然常识测验编题计划,第二单元 测题的编写,一、收集测验资料设计项目的依

36、据 题目来源 已有标准测验 理论和专家的经验 临床观察和记录 二、命题的一般原则 内容:符合目的;代表性;相互独立 文字:准确;简要;意义明确 理解:确切答案;普遍性 社会敏感性方面:社会负评价的内容,三、编制要领,种类: 提供型题目(论文题、简答题、填充题) 选择型题目(选择题、是非题、匹配题),(一)选择题,构成:题干 + 选项(正确选项与诱答选项) 原则: 题干所提的问题必须明确选项要简短,必要的叙述或相同的修饰语应放在题干中;每题只给一个正确答案; 各选项长度应相等; 避免题干用词与选项用词一致;选项最好用同一形式,(二)是非题,注意事项: 内容以有意义的概念、事实或基本原则为基础。

37、每题只包含一个概念,避免两个以上的概念在同一题中出现,造成题目似是而非,或半对半错。 尽量采用正面肯定的叙述,避免反面陈述或双重否定的句子。如“生物没有不是由细胞组成的。” 表达意见的题目,最好说明意见的来源和根据。“是”与“非”的题数应大致相等,且随机排列。,(三)简答题,形式:填充题、简答题 原则: 用问句形式 填充题空格不宜过多 每题只有一个正确答案,(四)操作题,原则: 明确测量目标,将其操作化 尽量选择高真实性的项目 指导语要简明扼要 制定评分标准,第三单元 测验的编排和组织,(一) 合成测验 (二)预测与项目分析 (三)信度和效度考察 (四)常模制订 (五)编写指导手册,一、合成测

38、验,(一)选择与审定试题 选择试题形式: 取决于测验的目的、材料性质、测验对象、各种实际因素。 审定题目: 题目范围:要与双向细目表一致;题目数量:要比最终所需要的数量多,以便筛选或编制复本; 题目的难度:测验目的;应有一定的分布范围; 项目说明: 用词力求清楚明白。,(二)测题的编排 原则 逐步由易变难 同类型题目放在一起 根据各类型测题本身特点排列 排列方式 并列直进式:韦克斯勒量表 混合螺旋式:比西量表,二、试测与项目分析,(一)试测对象取样 施测过程与施测情景 时限可稍宽一些 记录被试的各种反应。 (二)项目分析,三、信度和效度考察,四、常模制订,常模参照测验 方法:测验对象标准化样本

39、施测评分统计(代表性分数分布),五、编写指导手册,1、测验的目的和功用; 2、编制测验的理论背景以及选择题目的根据和 测验的构成; 3、测验的实施方法、时限及注意事项; 4、测验的标准答案和评分方法; 5、测验的信度和效度资料; 6、常模资料。,第七节 心理测验的使用,第一单元 主试资格 知识结构:基础知识、相关知识 专业知识和专业技能 职业道德:测验的保密和控制使用;测验中个人隐私的保护,第二单元 测验的选择,所选测验必须适合测量的目的 所选测验必须适合心理测量学的要求,第三单元 测验前的准备及注意事项,(一)测验前的准备工作 1、向被试预告测验:测验的时间、地点、内容,让被试做好心理准备。

40、 2、熟悉测验程序:测验内容、施测步骤、记分方法、分数解释。 3、准备测验材料。 4、准备测验环境:通风、采光、噪声、桌椅高度、桌面大小、挂牌以防止以外干扰等。 5、熟悉测验的指导语:告诉被试如何选择反应形式(划勾还是涂黑),说明时间限制,例题演示,有时告知被试测验目的。,二、测验中主试的职责 按照指导语要求实施测验 测验前不讲太多无关的话 对被试的反应不要暗示性反应 对特殊问题有所准备(如作弊、被试不配合等)。,三、建立协调关系 协调关系:主试和被试之间的友好、合作、能促使被试最大限度做好测验的关系,第四单元 测验实施的程序及要素,一、指导语:被试、主试 二、时限 三、测验的环境条件,第五单

41、元 被试误差及控制方法,应试技巧与练习效应 动机与焦虑因素 反应定势 求快与求准的反应定势 喜好正面叙述的反应定势 喜好特殊位置的反应定势 喜好较长选项的反应定势 猜测的反应定势,第六单元 测验的评分,一、原始分数的获得 为使评分尽可能客观,有三点要求:对被试反应的及时和清楚的记录。特别是对口试和操作测验。要有一张标准答案或正确反应的表格,即计分键。将被试的反应和计分键比较,对反应进行分类 二、原始分数的转换,第七单元 测验结果的报告,一、测验分数的综合分析 根据心理测验的特点分析。对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释。 不能把分数绝对化,对导致测验结果的原因(遗传、

42、经验、测验情景)的解释要慎重。 必须充分估计测验的常模和效度的局限性。解释分数应参考其它有关资料(受教育经历、文化背景、面谈内容、习惯、态度、兴趣、动机、健康、言语能力以及其他测验资料)。 对来自不同测验的分数不能直接加以比较。,二、报告测验分数,1、使用当事人所理解的语言。 2、要保证当事人知道这个测验测量或预测什么,但并不需要作详细的技术性解释。 3、如果分数是以常模为参照的,就要使当事人知道他是和什么团体在进行比较。 4、要使当事人认识到分数只是一个估计。 5、要使当事人知道如何运用他的分数。,6、要考虑测验分数将给受测者带来什么影响。 7、测验结果应向无关的人员保密。 8、对低分者的解释应谨慎小心。 9、报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医学治疗 > 心理健康教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报