心理测量学整理.doc-道客多多_道客多多docduoduo.com

资源描述

1、一、什么是测量测量的特征不是使用工具,是对事物加以确定.依据一定的规则，结果的量化。测量：依据一定的规则对客观事物进行数量化确定的过程。二、测量的要素1、单位计算事物标准量的名称好单位的条件：具有确实的意义具有相等的价值（具有等距性）没有相等单位就不能加减运算。2、参照点（计算事物量的起点）绝对参照点相对参照点绝对零点没有绝对零点就不能乘除运算。3、量表（具有一定单位和参照点的连续体）一般智力：注意记忆观察思维概念、判断、推理想像一、心理测量的定义依据一定的规则，对人的行为进行数量化确定的过程。二、心理测量的特点间接性：测量工具不唯一影响因素多测量对象是人（人能主观调控）反

2、应量化的过程复杂不可复验性相对性客观性：刺激的呈现是客观的反应的量化是客观的结果的推论是客观的三、心理测量的种类按功能分：能力测量、学绩测量、人格测量按对象分：个别测量、团体测量按材料性质分：文字测量、非文字测量按测量目的分：描述性测量、诊断性测量、预测性测量按测量要求分：最高作为测量、典型作为测量按解释分数的方法分：按测量的性质分：构造性测量、投射性测量四、心理测验陈选善观点：测量是一群或一个标准的刺激用以引起人们的行为，根据此行为来估计制定品德性格等。一、在教学中的应用对教师而言：1、如何进行考试分析 2、如何组合与解释测量结果 3、如何编制测验：题型选择编制计划具体的编制技术 4

3、、关于题库建设对学生而言：1、激励 2、提供反馈二、在教育管理中的作用教学评价：1、各种“率” 的问题 2、评价的信息来源问题学生管理问题：1、成绩管理 2、思想政治工作学校行政管理：1、人员安排 2、工作量化处理三、在实际工作中的应用 1、选人（选材） 2、安置 3、诊断 4、咨询四、在理论研究中的应用 1、搜集资料 2、建立和检验假说 3、实验分组一、对测验的错误看法：1、完美无缺论 2、测验无用且有害二、正确态度1、测验是心理学研究和决策的辅助性工具 2、测验尚不完善 3、防止滥用：编制、修订出版、发行使用者资格一、误差的定义及种类定义：由与测量目的无关的因素所引起的不准确或不一致效应。

4、种类：系统误差：恒定而有规律的效应，大小、方向确定。随机误差：大小方向不确定，无规律而循。抽样误差过失误差二、真分数定义：一个测量工具在测量者没有误差时所得到的纯正值三、误差的来源来自测验内部（本身）：1、题目取样（行为取样）2 、试题的编制技术来自施测过程：1、物理环境 2、主试特征 3、评分计分 4、意外干扰来自被试：1、测验动机 2、测验焦虑：测验前或测验过程中所产生的一种紧张的不愉快的情绪体验。影响测验焦虑的因素：能力水平（负相关）结果的重要性（正相关）抱负水平也叫走向水平（正相关）测验经验人格成因 3、学习、发展教育 4、练习效应：对于智力较高者效果较明显着重速度的测验效果较明显做同

5、一个测验比做复本的显著两次测验的时距越长，练习效率越小 5、反应方式：独立于测验内容的反应倾向 6、生理因素一、什么是信度理论定义：可靠性、测量的一致性程度。（一致相同）几点说明：1、一组或一列测量的特征 2、信度的取值范围 3、对信度的要求 4、任何测验都可有不止一个信度系数 5、信度指明了测量结果的不一致程度，但没有说明不一致的原因。6、高信度不是测量的最终目标 7、信度的概化能力是有限的（结果的推论）二、信度的应用解释个人分数的意义 1、测量的标准误 2、估计真分数所在区间对不同测验分数的比较一、再测信度含义：同一个测验对同一组被试先后两次测量所得结果的相关。计算方法：相关法影响因素：

6、时间所测量的特性是否稳定（稳定性系数）时间间隔的确定二、复本信度含义：将两个等值型的测验施测于同一组被试，所得结果的相关。等值：相同的内容范围、题型、题量（测验的长度）、区分度、种类及影响因素。三、内部一致性信度内容一致性的含义同质性：指的是测验内部所有题目的一致性（非形式、非内容一致，是被试在题目上得分的一致性）内部一致性的测量1、分半法（分半信度）：将一个测验分成两半，两半分数的相关。校正方法：斯皮尔曼布朗校正公式条件：两半分数变异相同弗朗那根公式条件：两半分数变异不同如何分半：奇偶题分半法不适合分半的情况：有任选题有上下、有牵连的题目分半信度不是内部一致性的最佳估计，分半信度可以

7、与等值性系数同样解释。2、库德-理查逊法条件：二分法计分3、克伦巴赫系数条件：非二分法计分4、因素分析法四、评分者信度不同评定者评定的一致性程度凡是能够产生随机误差的因素都会影响信度。一、被试样本被试团体的异质性：异质性分数范围相关系数被试团体的平均水平二、测验的长度：增加长度可以提高信度三、测验的难度：极端难度、中等难度下将产生最广泛的分数的分布。四、评分的客观性一、什么是效度理论定义：有效性、正确性程度测验测量的是什么特性？对该特性测的有多准？（在多大程度上测量了所有测量的特性）几点说明：1、一组或一列测量的特性。2、任何测量工具都只是针对一定目的制定是有效的。3、测量的有效性并

8、非是“全有 ”或“全无”的关系。二、信度与效度的关系1、信度是效度的必要而非充分条件。（有效必须可信、提高信度可以提高效度）2、信度控制效度三、效度的种类内容效度 1、含义：测验题目作为测验内容的代表性取样的适当程度。2、高内容效度的条件要有界定的、完好的内容范围题目必须是所界定的内容范围（代表性取样、深度取样、广度取样）3、内容效度的特点内容效度：多用于学绩测验特定性：I.使用时，内容范围一致II.评价时，内容范围一致，测验的概化常与表面效度弄混：表面效度低才能测出真实情况。构想效度（多用于心理学理论研究）构想：心理学理论所涉及到的抽象而属于假设性的概念。忌：通过测验界定概念测验测量的是什

9、么构想？（说清楚研究的是什么）Eg.幸福度：主观幸福感、心理幸福感。学业情绪：有无非学业情绪对该构想测得有多准？思路：1、依据某一理论结构提出各项关于心理品质的假设 2、按照基本理论做出关于测验的推论 3、适用实证或逻辑的方法验证结果与推论的符合度综合讨论：重点讨论假设与结果不符合地方思辩、实证效标效度（多用于预测情况）1、含义：测验对效标预测的有效性效标：衡量测验有效性的标准 2、效标的种类：学业成就等级评定临床判断特殊训练的成绩实际工作表现对团体的区别其它现成测验成绩3、效标效度的种类同时效度：预测源资料与效标资料同时获得。两种测量的目的不同，预测源资料取代效标资料的收集。预测效度：

10、先获得预测源资料，后获得效标资料。预测被试将来的行为表现。4、效标测量的特性：多样性、特殊性、时间性一、内容效度的估计1、专家判断（逻辑分析）：题目与内容范围的符合度做出判断。注：谁是专家？主观：评定不一致，无量化指标 2、统计分析如果相关高，一般可推论测验内容效度高如果相当低，至少一个测验缺乏内容效度 3、再测法 4、经验法二、构想效度的估计测验内方法：研究测验的内部构造 1、确定测验的内容效度 2、分析对题目进行反应的过程 3、考察测验的同质性测验间方法：研究测验间的关系 1、相容效度（高）2 、区分效度（低） 3、研究测验的实证效度 4、实验控制在一场决定前途命运的考试前实施考试焦虑

11、测验。举行两场考试使被试相信，一场关系重大、一场无关紧要将焦虑测验与考试结果联合起来比较。收集被试的生理指标。三、效标效度的估计相关法：预测源（高考成绩）效标（大学成绩）显著性检验法命中率功利率使用测验的利弊比较 S 代表选人程序的费用一、关于效度的评价问题关于内容效度的评价任何测验必须考虑问题，学绩测验尤其注重。缺乏理想的客观的数量指标。关于构想效度的评价：提出假设、检验假设有些构想概念十分模糊缺乏明确的操作程序关于效标效度的评价：主要用于预测（对于人员选拔具有重要意义）效标资料的获取二、关于影响效度的因素问题测验的因素：测验内容、测验的难度、测验的长度、信度被试的因素1、被试取样2、干

12、涉变量人的某些特征，由于这些特征的影响，使得这些测验对不同的被试团体具有不同的可预测性。C 看作 A、B 的干涉变量：A 、B 间的相关的有无或大小，因 C 的不同而不同。A 对 B 的影响有无或大小，因 C 的不同而不同。施测过程三、关于效标资料的概化问题概化：指在一定条件下得出的结论可否用于其它情况概化的内容（方面）1、预测源的概化使用同一测验的不同复本是否有效在同一测验内，测验的预测能力对于不同水平的被试是否一样。2、效标的概化 3、施测情境的概化不同的施测者、不同的施测条件以及在不同的指导语或心向下，做测验是否有效。4、被试团体的概化测验对于取自同一总体的另一样品是否有效测验对于不同

13、性别、不同年龄、不同教育水平、不同的社会经济地位、不同地区、不同民族、不同学校、不同职业的被试是否有效。5、建立效度的方法的概化交叉效度分析：对两个取自同一总体的样本，分别建立预测源与效标之间的关系。具体操作程序：1、从一个样本中搜集测验分数及效标分数及计算相关系数 ,并导出回归方程。2、应用由第一个样本导出的回归方程计算第二个样本每个人的预测效标分数。3、搜集第二个样本真正效标分数，计算两个效标分数的相关。一、对个人的预测预测的效标分数预测误差估计真实的效标二、影响测验效度的因素基础率未经挑选的团体中成功的人数比例。极端基础率的情况下，使用测验是无效用的。使用测验必须比单纯依据基础率能做出

14、更多的正确决定。录取率分数线：录取率、正命中率、总命中率、最低能力水平一、难度的含义及计算理论意义：难易程序数学定义：通过率（P）未通过率：全体受测者在项目上的平均失分与项目满分之比。绝大多数情况不允许出现极端难度，因为无区分度。如果整体正态，极端取样均值的均值为总体均值。二、难度的相对性（常模参照测验下的难度的相对性）相对的难度=心理难度影响因素：1、被试群体的平均水平2、测验的编制技术 eg.用测量学理论分析大学考试的问题三、难度对心理测验的影响1、影响分数分布：正偏态、尖峰态、低峰态.中等难度之下将产生最广泛的分数分布 2、影响离散程度、信度 3、影响签到率四、难度水平的测定总结性测验允

15、许极端难度出现通常要求测验中的难度为 0.200.80 之间，且正态分布人员选拔情况下，难度视录取率而定一般中等难度较合适五、难度等距量表用于难度差异比较含义：又叫作鉴别力，指项目对所测量的特性的区分程度或鉴别能力二、区分度与其它测量指标的关系1、与难度的关系：一般情况下，区分度与难度呈倒 U 型曲线关系，但也受多种因素影响2、与信度的关系：整个测验的区分能力 3、与效度的关系：有效区分效度高三、确定区分度的方法相关法项目分与效标分数的相关，用测验总分代替效标分数使此方法简单。但前提条件测验有效，就考试而言此前提成立。统计方法：积差相关要排除共变因素影响。经验：当项目分 0，高分组通过率低分

16、组通过率D0，高分组通过率低分组通过率分组原则（按高低分组）中间分两半：组内人数多，组间差别小.上下取两个：组内人数少，组间差别大。原则：组内人数总够多，组间差别足够大.经验：上下 27%为最佳分组点。项目特征曲线项目反应理论、现代测量学理论、全国不足 10 人区分度的相对性1、计算方法不同区分度值不同，二者无可比性。2 、区分度与题目难度有关。 3、区分度与被试团体的异质性有关。4、相关法确定区分度受样本容量影响：计算方法不同影响样本 5、用极端组通过率作区分度指标受分组标准影响项目分析报告的有关内容:项目分析简表：题号、难度、区分度、评价如果正确答案被所有被试选择，说明题目太易或提供某

17、种暗示线索。如果某错误答案没有人选择，说明该选项无变性。如果所有被试选同一错误答案，说明是教学问题或题目问题或答案错。如果高分组被试选择集中在两个答案上，且二者选择率相近，说明该题可能有两个正确答案。如果高分组对正确答案的选择等于低于低分组，说明该题考虑东西与被试水平无关。如果一题目被试未作答过多者或选各个备选答案者几乎相等时，说明该题可能过难或题意不清，被试无法作答或凭猜测作答。一、分数解释：要解决如何使分数具有意义如何将分数的意义传达给有关的人二、原始分数：不能直接用原始分数组合与解释测量结果原始分数的特点：1、不具有绝对零点（心理学） 2、具有不确定性（误差来源） 3、具有孤立性 4、不

18、具有等距性：同一次测验中相同的分数差异不代表相同能力水平差异。两次测量中不同被试成绩提高幅度相同不意味成绩水平提高程序相同。三、导出分数（= 量表分数）：具有一定单位和参照点的量表分数。常用二类导出分数：常模参照分数、标准参照分数一、经验法：依据经验凭直觉对各变量进行组合。优点：从整体上对各因素加以考虑，每个判断都根据特定的人进行分析。当无法量化的时候，经验法是行之有效的方法。缺点：经验法的加权是一种主观的加权。缺乏精密的统计分析，无精确数量指标，对评定者要求太严格。二、标准分数差异加权法单位加权，但其不等量等量加权，但重要性程度没体现标准分数差异加权最科学，但目前为止无人使用此方法，因为 P

19、值难获得。三、连续选择法条件：各变量不具有互偿性，为每个变量确定最低标准。四、多重回归法条件：各变量有互偿性第三节各种组合分数方法的比较一、应用范围1、选人：通常用连续选择或多重回归的方法，经验法和区分分析也可用于选人（但不如前两种好）2、分类与安置：区分分析（操作难） 3、描述二、资料特征输入资料经验法：可以接纳任何资料（具有资料）其它方法：都要求统计资料（数量）除连续选择法外：连续数据输出资料经验法：任何形式连续选择法：接受、不接受多重回归法：预测的效标分数区分分析：个人与团体的相似度三、加权方法经验法：主观加权其它方法：实际导出的加数四、效度合成体的效度1、合成体的效度要显著大于单

20、个预测源的效度。2 、合成体的效度要显著大于基础率。第四节常模参照分数常模参照分数：把受测者的成绩与具有某种特质的人所组成的团体进行比较，依据个人在比较团体中的相对等级来评量它的测量结果。一、常模团体：具有某种共同特征的人所组成的一个群体或一个群体中的一个样本。1、常模团体必须明确界定。2 、常模团体必须是所测量的群体的代表性取样。 3、取样的进程必须详细描述。4、注意常模的时间性。 5、将全国常模、地方常模和特殊常模结合使用。二、几种主要的常模参照分数发展量表：人的很多心理特点都是随时间推移系统地向前发展的。1、心理年龄（智龄） 2、年纪当量 3、发展顺序量表对发展量表的评价:优点：1、它

21、以年龄或年纪当量作为单位来报告分数，易于了解。2 、可与同等团体直接比较。3、为个人内比较和纵向研究提供了基础。缺点：1、只适用于所测的特质随年龄或年级发生系统变化的情况。（发展量表对成人不适用）2、只适用于在典型环境下成长的儿童。3 、发展量表的单位在各年龄阶段、各年级的单位不同。4、获得同样的年龄或年纪当量的分数，不一定具有相同的智力或学业水平。商数1、比率智商：1916 年斯坦福 -比内智龄/实龄 100比率智商的问题：智力不是直线发展（不具有等距性）而实龄则是直线发展，两者进行比不合理。在不同的年龄组，智商分数有不同的标准差。因而相同的智商对于不同的年龄具有不同的意义。2、教育商数

22、：教龄/实龄 100。教育商数的问题：教龄的含义不够明确。3、成就商数：教商/ 智商 100 教龄/智龄 1004、离差智商百分等级优点：1、容易计算，易于理解。 2、不受原始分数分布形态影响。 3、可以用白分等级进行个人或团体的比较。缺点：1、没有相等的单位，属于顺序量表。 2、原始分数转换为百分等级之后，趋近于平均数的原始分数的差异被扩大，远离平均数的原始分数的差异被缩小。3、百分等级对于特别大的团体来说，不太适用。标准分数1、线性转换的标准分数 2、常态化标准分数 3、标准分数的其它形式：T 分数 T = 50 +10Z 标准九分 Z = 5 + 2z标准参照分数主要分为两种：内容参照分

23、数和结果参照分数。一、解释分数要注意的问题影响因素问题常模资料与效度资料结合的问题测验分数只是个人真实水平的最佳估计关于测验分数的比较问题二、如何报告分数1、使用当事人所理解的语言。2 、要保证当事人知道这个测验测量或预测什么。 3、如果分数是以常模为参考的，要使当事人知道他是和什么团体进行比较。4、要使当事人认识到分数只是一个“最好”的估计。5、要使当事人知道如何运用他的分数。 6、要考虑测验分数给当事人带来什么心理影响。7、要让当事人积极参与测验分数的解释。一、确定测量目的测量对象测量目标认知目标的分类：1、知识：具体知识符号、术语；论述方式规则；规律性理论。2、理解：转译用自己的话复

24、述、翻译；解释用于说明总结资料。3、推论：推论- 预测结果；应用-新情况下解决问题。4、分析：分析构成成分、分析成分关系、分析组织原则。5、综合：推导，形成观点。6 、评价：内在标准，外在标准。测量目的：对什么人、测什么、要干什么二、拟定编题计划编双向细目表：内容、目标、权重用途：1、指出应写哪些种类题目，是否适当代表整体。2 、计分时，按其百分比计分。三、编题题目搜集有关资料1、智力测验选材原则：材料充实至少 5-6 种，尽量避免文化知识影响，材料要有普通性，材料有区分度，鉴别各年龄，引起被试兴趣2、学绩测验：选材要考虑目的要求，选材要能代表学科全部内容，材料要有普通性，材料要适合学生的程度，材料要能鉴别学生的学习水平，材料要有进取性，材料要切合社会生活需要选择测验的形式题目表达形式：纸笔、操作测验认出答案、做出答案注意：测验的材料性质接受测验的团体特点各种实际因素编写和修订题目1、题目取样要有代表性 2、题目范围

展开阅读全文