收藏 分享(赏)

自考05616 心理测量与评估 华南师范大学 常考重点.docx

上传人:myw993772 文档编号:4684211 上传时间:2019-01-07 格式:DOCX 页数:28 大小:525.89KB
下载 相关 举报
自考05616 心理测量与评估 华南师范大学 常考重点.docx_第1页
第1页 / 共28页
自考05616 心理测量与评估 华南师范大学 常考重点.docx_第2页
第2页 / 共28页
自考05616 心理测量与评估 华南师范大学 常考重点.docx_第3页
第3页 / 共28页
自考05616 心理测量与评估 华南师范大学 常考重点.docx_第4页
第4页 / 共28页
自考05616 心理测量与评估 华南师范大学 常考重点.docx_第5页
第5页 / 共28页
点击查看更多>>
资源描述

1、自考 05616 心理测量与评估 华南师范大学 常考重点第一章 绪论S1 测量和测量量化水平1、 测量的科学定义名词解释 :测量(识记)是按一定规则给所考察对象在某种性质的量度系统上指定值的活动。简而言之,测量就是使对象特点予以量化的活动。测量的要素:一是测量的参照点;二是测量单位2、 性质不同的量度系统(精确度水平由低到高)选择或简答 “名义量表” ,其上的值量化水平最低,只有类别标志的含义,不能施行任何运算(车牌号码) “顺序量表” ,其上的值量化水平略高,只有顺序的含义而不等距,既无可加性更无可除性,只可施行顺序递推的逻辑运算(品德评定 心理测量) “等距量表” ,其上的值不但有顺序含义

2、,还是等距的,即单位相等,所以量化水平更高,没有绝对零点,只有可加性而无可除性,故只可施行加减运算不可做乘除运算(温度)“比例量表” ,其上的值不但有顺序性,还等距、等单位、有绝对零点,既有可加性又有可除性,量化水平最高(身高 体重)3、 心理测量及其特点心理测量:是按规则给所考察对象的心理特质,在一定性质的量度系统上,即量表上指定值的活动。 心理测量的特点(与物理测量的区别跟物理测量比,有其显著不同的突出特点;即心理测量的性质具有:间接性、相对性和主体间交往性的突出特点:心理测量的间接性 (心理的相对性和稳定性)a 被测对象的心理活动,无论是他的感觉知觉,还是他的情感态度等,都不是测量活动的

3、主持者、施测者所能直接观察与了解的b 人的心理是世界物质发展到最高阶段的产物,个体的心理特性既是相对稳定的,又是对人的行为活动起支配决定作用的,因而会在人的行为的各个方面不断表现出来心理测量的相对性(测量结果的函数关系、测量结果取值)a 内部心理特性与外显行为间不存在确定性函数关系,测量结果只有相对意义b 按心理测量对象本身的特性,测量结果大都只能在顺序量表上取值,具有相对性;即使放宽某些要求,最多也只能在等距量表上取值心理测量的主体间的交往性a 作为心理测量活动对象的受测者并非静止消极的,只单纯接受施测;相反他要积极作用于测量活动本身b 测量活动所测的对象是受测主体的心理特性,而主体具有能动

4、性,所以一定要重视受测者在测量过程中的学习和迁移能力c 由于施受双方都是能动主体,处在同一发展层级上,因而有时其施受地位也可以互换,并非绝对固定4、 心理测验心理测验的定义(识记)名词解释心理测验是心理测量的一种,是更加符合实证科学精神与要求的心理测量中特别的一种。其定义一般认为是行为样本的客观而标准化测量行为样本的意思(领会)多选测验所直接测察的是:个体的外部行为这些外部行为应是:所要测察的内部心理结构的代表性“行为样本” 所测行为是否能构成代表性“行为样本” ,要经实际检验由客观事实资料来确证心理测验标准化(领会) (S3 所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科

5、学性)多选:标准化是所有测量活动走向科学的共同要求,包括:测验编制 即测量工具的标准化 测验实施与评分的标准化 分数解释的标准化心理测验客观性:(实操)测验的实施、评分与测验结果的解释应用都要严格按测验指导书的统一规定办,不能任意来确定;(编制与修改)测验开发编制过程中,测验项目难度及测试性能如何,应该依据客观事实来得出;筛选项目应通过调查研究根据事实资料来确定;(效果评估)标准化测验的实际质量如何更要通过实证检验来确定常模:打算要测的被试群体在所测特性上的一般水平与水平分布状态(S4 测验常模(识记)简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态;实际操作中是

6、指代表性被试样组在测验上得分的分布状况或分布形态)5、 心理评估(识记)就是使用测验、行为观察、晤谈、个案资料研究和其他测评程序(评定量表、问卷) ,为达到对个体作出深入的心理评价,从而进行收集和整合资料的活动。是临床心理工作的重要组成部分。途径:测验、行为观察、晤谈、个案资料研究、评定量表6、 心理评估过程的特点与作用(领会)心理评估是针对特定个体或少数个体的某种心理问题,连续不断地提出假设和检验假设的过程。心理评估的目的在于为决策服务;即为诊断决策,为职业选择、治疗建议、教育计划的决策,乃至为司法决策等服务。7、 心理评估与心理测量及测验的区别(简单应用)心理评估是通过多种途径、工具与方法

7、来收集和整合资料的,而心理测量是只通过量化的方法常在严格条件下使用标准化工具来收集资料的(心理评估包括了测量与测验在内但不限于测量和测验,它强调多种方法的综合运用,并强调不把任何一种方法收集到的资料绝对化)心理评估要完成的根本任务是要“作出深入的心理评价” 。评估中不但要收集量化资料还要收集质性资料,不但作出事实判断还要作出价值判断。S2 心理测样的发展1、 中国古代的心理测量思想和实践探索(识记):汉代推行察举制 三国时代魏人刘劭著有人物志一书,他奉行“中庸至德” 的儒家教义,对人的形质、人性、才具以及志业的“考课核实”做了深入的研究。著名的心理学家伍德沃斯将九连环称为“中国式的迷津” ,七

8、巧板则被称为唐图2、 科学心理测验的诞生:高尔顿:重视个体差异和提倡心理测量(心理测量运动的重要任务) 等级评定量表、问卷法及自由联想法的先驱;卡特尔:首次提出了“心理测验”一词; 1905 年比纳西蒙量表的编制发行,标志了人类历史上科学的标准化心理测验的诞生。19 世纪 80 年代是高尔顿的十年,90 年代则是卡特尔的十年,进入 20 世纪的头十年就属于比纳3、 各种类型心理测验的发展(识记)智力和能力测验的发展:1916 年美国斯坦福大学修订了比纳西蒙量表,推出了斯坦福比纳智力量表作为标准化测量工具,首次采用了“智力商数(IQ) ”来描述个体的智力水平。此后智商成为一个广为流传的概念。19

9、18年美国参加第一次世界大战,编织成了“军队甲种测验” “军队乙种测验” ,前者为一般常规的言语测验,后者为非言语测验学业成就测验的发展:1908 年桑代克发表了书法量表,1923 年斯坦福成绩测验发表,产生了第一个学业成就成套测验人格测验的发展:早期的人格测验起源于对精神病人的关爱,先驱是克雷佩林,他 1892 年对精神病患者实施自由联想测验。心理测验的另一领域涉及情感行为或非智力行为,适于这一目的测验一般称为人格测验;人格测验的三种技术:人格问卷的原型即自陈问卷 表现型技术或情境测验方法; 投射技术。心理卫生评定量表等的发展:上世纪 50 年代以来,心理卫生评定量表有了很大的发展。严格地说

10、,心理卫生评定量表并不属于心理测验的范畴,当然二者也不是截然分开的4、 心理测验的种类和功能多选按测验所测心理特性分类:能力测验;学业成就测验;人格测验;神经心理测验;心理卫生评定量表按接受对象规模分类:个别测验; 团体测验按施测方式分类:文字测验; 非文字测验; 情境测验; 计算机化测验;按测验对作答行为要求分类最高成就测验; 典型行为测验按测验分数解释参照体系分类常模参照测验;标准参照测验常模参照测验:参照体系是常模,即所测被试团体在所测特性上的实有水平分布。标准参照测验:参照体系是社会应有要求,即所设置的标准;这类测验上被试的表现,要跟社会设定的要求去作比较,看其是否达标,掌握的程度如何

11、,这样来解释测验分数的意义按测验刺激性质(按测验任务)分类:结构化测验 投射测验按测验目的分类:描述性测验 诊断性测验 预测性测验按测验的应用领域分类: 教育测验; 职业测验 临床测验 临床测验:广义上是指所有为临床工作之用的心理测验,包括智力、人格测验;狭义是指专为医学临床应用的或者某种心理咨询和辅导而设计应用的测验,包括神经心理测验、儿童心智缺陷测验、心理卫生评定量表等5、 心理测验的基本功能(鉴定个别差异最基本功能、描述、诊断、预测和评价功能) :认识和鉴定 清楚人的心理特征、结构、发展水平的实际状况及潜力如何,跟他人的差别何,并用量化的方式准确表示出来;以据此给出有针对性建议。描述、诊

12、断和预测的功能从鉴定个体差异中派生出来,并进一步派生出评价功能。这些都是心理测验的基本功能6、 理测验的应用领域:当心理测验应用在教育、职业、人事、心理咨询与辅导、以及科学研究当中时,会产生出其他的功能。在职业与人事领域,会发挥出 应 选、安置和分类功能;在心理咨询和辅导领域,会发挥出搜集资料、做出评估与诊断、协助决策、对干预措施或指导建议做评价等功能;在教育领域会用于学生、教师、管理者的评价,包括学生的学习和发展、教师和管理者的评价,在科研领域,可用于搜集资料、实验分组和提出与检验实验假设等S3 正确对待和使用心理测验1、 心理测验在我国的发展历史2、 正确对待和使用心理测验测验的错误观:测

13、验万能论:测验解决一切问题,分数绝对化; 测验无用论:测验侵犯个人隐私、违背民主原则。为宿命论和种族歧视提供依据测验的正确观: 一是认识到心理测验是心理学重要的研究方法,是决策的辅助工具; 二是认识到测验作为研究方法和测量工具尚不完善第二章 心理测量中的统计技术1、 数据和变量的种类: 变量种类:称名变量、顺序变量、等距变量、比率变量(名义、顺序、等距、比例量表) ;按照是否有连续性分为:离散性变量、连续性变量 离散性变量: 称名变量,如球衣号顺序变量,如成绩名次连续性变量: 等距变量,如温度比率变量,如考试成绩分数、能力/智力测验分数2、 总体 样本和取样 (理解)总体是具有某种特征的一类事

14、物的全体;总体中的每个基本单元但与称为个体;从总体抽取的一部分个体,称为总体的一个样本,这样的行动叫取样;而样本所含的每一个体,有时有被称为元素或样品个体数目超过 30 的样本称为大样本,等于或小于 30 的样本称为小样本,一般来说,样本越大,对总体的代表性就越强。S1 次数分布与集中量数 1、 测验分数的次数分布表与图次数(识记)即现象出现的频数,一般用符号 f 表示次数分布表的编制次数分布,指的是一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在轴上各个区间所出现次数多少的情况。次数分布表可分为简单次数分布表、相对次数分布表和累积次数分布表(以下累积递减、以上累积递增)全距是最大

15、数值和最小数值之差,又名两级差,用符号 R 表示,R=Xmax-Xmin 相对次数分布编制:将简单次数分布中各组的实际次数除以总次数(f/N)表 2-5次数直方图与多边图:次数分布图有次数直方图和次数多边图 表 2-1 表 2-2累积次数分布图 表 2-3测验分数的正态与偏态分布多选,或者考图正态分布曲线:一条单峰对称的曲线,如果这种形状的曲线还符合统计数学的某些要求就可称为正态分布曲线正偏态分布曲线:高峰偏向数量小的方向的曲线,即曲线尾巴指向正无穷大 表明一笔数据中数值小的数居多,难度小,测量集中在大部分人去负偏态分布曲线:高峰偏向数量大方向的曲线,即曲线尾巴指向负无穷大,表明一批数据中数值

16、大的数据居多,难度大,测量分数比较低2、 集中量数:指用来描述数据的集中趋势的特征量数包括算术平均数、中数、众数等3、 中数和众数中数:按大小顺序排列的一组数据中,位置居中的那个数称为中位数,简称中数众数有粗略众数和理论众数两类,粗略众数是指一组数据中频数出现最多的那个数,可通过观察法直接求得S2 差异量数与标准分数1、 差异量数:是用来描述数据离散程度的特征量数,包括平均差、方差、标准差平均差:即全组数据与其平均数的离差的绝对值的平均数,用符号 AD 表示方差与标准差:方差 S2 指的是这组数据的离均平方数的算术平均数。方差的算术平方根叫标准差,用符号 S表示集中量数的差异量数对数据分布形态

17、的影响简答论述集中量数影响着数据分布的位置:集中量数越小,则数据在数轴上的分布越靠左,集中量数越大,则数据在数轴分布越靠右。差异量数影响到数据分布曲线的“展形”或“胖瘦”:差异量数越小,则数据分布曲线越高瘦,分布的覆盖范围越窄;差异量数越大,则数据分布曲线越矮胖,覆盖范围越宽。2、 正态分布的性质:简答 正态分布曲线是单峰对称的,以过平均数点的垂线为对称轴; 正态分布曲线上平均数对应点最高,然后向两侧逐渐下降,不断地靠近基线无限延伸,但始终不和基线相交; 正态分布曲线下的总面积为 1,过平均数点的垂线将正态分布曲线下的面积划分为各是 0.5 的相等两个部分; 正态分布曲线,根据平均数、标准差的

18、不同有不同的分布形态。平均数决定曲线的位置,标准差决定曲线的展形; 正态分布曲线下,随机变量离平均数多少个标差距离内取值的概率,有一定规律。正负一个标准差之间取值的概率为 68.26%;正负两个标准差之间取值的概率为 95.44%;正负三个标准差之间取值的概率为 99.72%。所以服从正态分布的随机变量几乎所有取值都处于正负三个标准差之内3、 标准分数地位量数与标准分数地位量数:指反映次数分布中各数据所处地位的量nxxXn21标准分数(识记)又称 Z 分数,是原始分数以本组标准差为单位时对本组平均数的距离;其值就是该分数与平均数之差除以标准差后所得之商标准分数的性质简答 标准分数的平均数为 0

19、,标准差为 1(即转换成 Z 分数后,以 1 为单位,以 0 为参照点) ; 标准分数是原始分数线性转换的结果,其分布形态和原始分数分布形态完全相似; 标准分数有正、负号与绝对值;正负号表示原始分数是大于还是小与平均分数,绝对值表示原始分数对平均分数的距离; 如果原始分数呈正态分布或近似正态分布,查正态分布表可知,在正负 3 个标准差之间的取值范围即可能为99.73%,这就意味着原始分数的绝大多数取值都在正负 3 个标准差之间。由标准分数的求法和性质可知,把原始分数转换成标准分数的实质,就是把单位不等距和缺乏明确参照点的分数,转换成为以标准差为单位,以平均数为参照点的量表分数。可以证明,任何一

20、组数据的标准分数的平均数为 0,标准差为 1.标准分数的应用简答A 明确每个原始分数在分布中的相对位置;B 比较两种测验成绩的优劣;C 计算 被试接受不同测验之后的总分和平均分S3 相关与回归1、 相关 (事物或现象之间的相互关系有两种类型:函数关系、相关关系)变量间的关系相关关系:是指两个事物或现象之间存在不十分严格的依存关系,其特征是现象与现象之间存在一定的数量关系,但又不象函数关系那样能以一个变量的数值精确地求出另一个变量的数值。 (回归分析)相关关系的分类:选择按照变量关系的表现形态,相关可分为直线相关和曲线相关。图 2-11按照数值变化的总趋势,相关关系又可分为正相关和负相关;图 2

21、-10按照两个变量联系的紧密程度,相关关系还可以分为:完全相关、高度相关、低度相关、零相关相关关系的性质 在相关分析中,有相关系数来描述变量之间的相关方向和程度。相关系数取值范围-1 和+1 之间,相关系数的正负号表示相关的方向,正号表示为正相关,负号表示负相关。相关系数的绝对值表示相关程度,绝对值越大,表示相关越强,绝对值越小,表示相关程度越弱。相关系数等于 0 时为零相关(即两个变量不存在相关关系,彼此独立) ,等于为完全相关。需要特别注意的是,事物间有相关关系并不能说明就存在有因果关系。积差相关系数是心理学研究中常用的相关系数之一。积差相关又称积矩相关,皮尔逊提出的一种计算变量间的积差相

22、关系数,因而有称为皮尔逊相关SXxZi当两列变量符合以下条件时,可以计算变量间的积差相关系数 多选简答两列的变量均为连续变量; 两列的变量的数据一一对应; 两列的变量所来自的总体服从正态分布 2、 回归名解 回归分析:通过变量间不确定的关系,去发现变量内在的、隐藏的数量关系规律性的统计学方法选择回归方程 y 值计算(a 是回归线在 Y 轴的截距,b 是回归线的斜率,称回归系数):名解决定性系数:在回归分析中,用决定性系数来表达回归方程式的有效性程度,决定性系数就是相关系数的平方 r2回归线有两个特征,一是截距,另一是斜率。截距是指自变量取值为 0 时因变量的取值。斜率表明自变量对因变量所具有的

23、影响程度。第三章 测验的编制、实施与评分S1 测验的编制1、测验编制的一般程序:确定测验目的; 拟定编制计划; 开发测验项目; 预测和项目分析; 合成测验; 测验的标准化; 测验的质量检验(收集信度、效度资料) ; 编制测验手册;确定测验目的测验对象:测验要测的人,或者说测验编成后要施用于何种群体测验目标:所编测验是用来测量的是人的什么心理特质; 测验用途:测验在社会生活、教育过程、心理咨询辅导与科研工作中的具体功用。拟定编制计划(使用双向细目表)理解工作内容:确定测验所包含的内容和各种技能,以及每一种内容或技能在测验中的地位.bXY XYlX2)( XbYa用 途:一是:明确了应该编哪方面的

24、测验项目以及多少测验题目,结束后可比照核对测验项目是否反映了所要测量的领域;二是:记分时可按计划中百分比确定每类测验项目的分数标准。开发测验项目:测验编制资料,遵循以下原则: a 资料要有丰富性; b 资料要有普遍性;选择项目的形式,项目确定的重要原则 :a 使受测者容易明了测验的方法; b 使受测者在完成时不会因为项目形式不当而出错; c 测验过程省时; d 计分省时神力; e 经济编写测验项目:a 项目来源:I 直接选用国内外优秀的相关测验项目;II 修改前人测验中的有关项目;III 自己独立编b 编写项目的要注意的问题:I 测验项目的取样应该具有代表性;II 项目的范围与测验计划相一致;

25、III 测验项目的难度应有一定分布空间; IV 初编项目数量要比所需数目多一倍至几倍,以备筛选;V 用语力求精炼简短,浅显明了;VI 作答说明必须简明c 初步检查的方面:1 测验项目编制的技术性问题 2 初步确定测验项目是否具有必要的有效性与可信度预测和项目分析预测,预测要注意的问题:a 对象取自正式测验准备应用的群体; b 样本应有充分代表; c 实施的情境与过程应与正式测验相同;d 时间充裕,可适当延长时间,使被试将题目完成从而获得充分的反应资料 e 测验过程中,随时记录被试的反应项目分析,项目分析的内容包括 :质的分析和量的分析。一是要从内容上检查取样的适当性,文字表达是否清晰;二是要对

26、预测的数据结果进行统计分析,确定难度、区分度及备选答案的适宜性合成测验:包括三部分内容:测验项目的选择; 测验项目的编排 测验复本的编制测验项目的选择,标准由三个:一是能否符合测验目的与性质;b 二是项目难度要恰当;c 三是项目区分度要高;测验项目的编排,题目编排一般有一下两种方式:a 逐类直进式(韦克斯勒量表,同一分测验内由易到难) ;b混合螺旋式(比纳西蒙智力量表) 测验复本的编制,编制复本的关键是等值,所谓等值需要符合下列条件(如何编制复本):A 复本和原本所测量的是同一心理特质;B 复本和原本必须具有相同的内容和项目类型;C 复本和原本不能有相同的项目;D 复本和复本的项目数量必须等同

27、,并且有大体相同的难度和区分度;E 在测量同一团体时,复本和原本的分数分布大致相同;测验的标准化:所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科学性测验内容(工具)标准化;施测过程标准化;测验评分标准化;分数解释标准化测验的质量检验(收集信度、效度资料) ;编制测验手册包括以下内容: 测验的目的和功用;编制测验的理论背景及开发测验项目的依据;测验的实施方法、时限及注意事项;测验的标准答案和评分方法;常模资料;测验的信度与效度资料2、测验项目的编制技术命题的一般原则:(理解)1测题要符合测验目的;2内容取样要有代表性;3题目格式不要让被试产生误解;4文句要简明扼要,排除无关因

28、素;5应有不致引起争论的确定答案(创造力和人格测验除外) ;6各个试题必须彼此独立,不可相互牵连;7题目不可含有暗示本题或其它答案的线索;8题目内容不要超过受测团体的知识能力;9所提出问题应避免涉及社会禁忌和个人隐私;10施测与评分省时.几种主要的测验项目类型:1 论文题 2 选择型项目 3 判断型项目 4 匹配型项目 5 填空型项目 6 简答题 7 操作题 8联想题和投射题罗夏墨迹测验:是以墨迹图来引起被试者的联想,探测被试的人格特征S2 测验的实施1、 主试的资格(测验的主持和实施者在心理测量中被称为主试;只有训练有素、资质合格的心理测试工作者才能胜任)满足三方面要求:心理学基础知识;心理

29、测验的理论知识 心理测验的专业技能 测验工作者的职业道德很能体现心理测验工作者的职业道德的表现之一就是对测验的保密2、 测验的选择(临考前看书) P46-47根据测验目的来选择测验:测验的目的是我们选择测验的首要考虑问题。由于每个测验的用途和使用范围都是不一样的,所以研究者在使用测验之前都要研究测验的功用,优缺点;在实际工作中,不能通过测验的名称盲目选择测验,必须了解该测验真正测的什么心理特这及使用范围和功效,否则会造成测验使用不当。根据被试的情况来选择测验 :被试的特点和具备的条件也是选择测验的重要依据。因为每个测验都有一个使用的年龄和年纪范围,不在此范围的被试是不能使用这一测验。根据测验的

30、质量来选择测验:测验的技术参数是一个测验编制好坏的重要指标,测验的信度、效度和常模的优劣常被用来选择的依据;另外还要考虑测验的时效性,这包括项目内容时效和常模资料时效两个方面。3、 测验的准备预告测验 准备好测验材料 熟悉测验的具体程序 确保满意合适的测验情境 协助被试做好准备主试应协助被试做好哪方面的准备:时间准备 生理准备 心理准备4、 测验的实施:指导语和时限 做记录 如何对待被试的要求 测验中主试的职责指导语和时限:指导语一般包括针对主试和针对被试两部分。针对主试的指导语通常单独印在另外一张纸上,主要是对测验的细节的进步一步说明及注意事项。做记录 记录要隐蔽 记录要忠实 如何对待被试的

31、要求 测验中主试的职责 遵从指导语; 测验前不讲无关的话; 主试在测验时应集中注意,认真观察被试的所有反应行为; 在任何情况下,主试都不能对被试的回答有所暗示; 在测验中也可适当强化被试的行为,以此鼓励被试继续集中注意力在测验上; 鼓励被试回答; 对特殊问题有所准备; 与被试建立良好的协调合作关系 5、 影响被试作答反应的因素:测验技巧 练习效应 教练测验 应试动机 测验焦虑 反应定势测验技巧:被试的测验经验和测验技巧会影响测验分数 练习效应:任何一个测验在第二次应用时,都会有练习效应而使得成绩有所提高教练测验:是针对着测验内容与形式进行专门的教学和辅导应试动机测验焦虑:是指被试因接受测验而产

32、生的一种忧虑和紧张情绪,它会影响测验结果的真实性反应定势:也称反应的方式或反应风格,是指独立于测验内容的反应倾向;即由于每个人回答问题习惯的不同而使有相同能力的被试获得不同的分数(S7 反应定势 :反应定势与测验内容有关,指被试有意或无意地掩盖其真实情况按自己或别人所希望表现的形象进行作答。如应聘工作。常见的反应定势:社会称许性:指被试在测验上有依附社会所期望的行为方式作答的倾向)。不用的反应定势对测验分数影响如下:“精确速度”反应定势; 肯定(否定)反应定势; 偏好特殊位置反应定势; 偏好较长选项反应定势;猜测反应定势 S3 测验的评分与解释1、 测验的评分:评分是整个测验施测过程的最后步骤

33、,也是为测验结果的解释报告做好准备的关键环节原始分数:根据被试的实际作答,按测验的评分程序与标准,对每个测验项目及整个测验上所作反应评出的分数。原始分数的转化2、 测验分数的解释如何看待测验分数的意义:解释分数的原则a 主试应充分了解测验的性质与功能b 对导致测验结果的原因、解释应慎重,谨防片面极端c 必须充分考察测验的效度和局限d 解释分数应参考其他相关资料e 对测验分数应以“一个区间分数”来对待,不应以“特定的数值”来解释f 对来自不同测验的分数不能直接比较如何向被试和有关人员报告测验分数,报告分数的原则a 使用当事人所理解的语言b 要保证当事人知道这个测验测量或预测了什么c 如果分数是以

34、常模为参照的,就要使被试知道他和什么团体进行比较d 要使当事人认识到分数只是一个估计e 要使被试知道分数将被如何运用f 要考虑测验分数将给被试带来什么心理影响g 测验结果应向无关人员保密h 对低分者的解释应谨慎小心I 报告测验分数时应设法了解被试的心理感受并采取适当的措施加以引导第四章 项目分析与常模S1 项目分析 名解项目分析:就是对测验中每个项目的质量,都进行质和量的分析评价,从而为筛选修改项目提供依据,确保和改进整个测验质量(主要包括难度和区分度) (S3 项目分析,项目分析的内容包括 :质的分析和量的分析。一是要从内容上检查取样的适当性,文字表达是否清晰;二是要对预测的数据结果进行统计

35、分析,确定难度、区分度及备选答案的适宜性) 1、 项目难度 项目难度(识记)是用来表示测验项目难易程度的指标。用被试通过率 P 来表示,如果大部分被试能答对就认为该项目难度小,反之难度大难度的计算:二值计分制的难度(评分规则只有对或错,采用“全或无”办法计分,一般记为 1 分或 0 分的测验项目) ,a 通过率: P=R/N,R:答对人数;N:总人数(P 通过率越大,难度越小)b 高-低分分组法(极端分组法):P=(PH+ P L) /2 *分数从高到低排列,分成高分组合低分组,各取 27%,分别计算通过率。求两组通过率的算术平均数非二值计分制的难度(论述题和简答题都是非二值计分制)P=X/X

36、MAX (X 为平均分,XMAX 为该题的满分)项目难度对测验的影响(领会)难度过大或过小都会造成测验分数偏离正态分布,因此测验难度适中一般来说是比较理想的情况同时测验难度也会影响测验的信度测验难度对测验的鉴别力也有一定影响项目难度的等距量表(等距量尺):按照项目难度的本来含义把它表达在被试能力水平量表上,即直接在横轴上来指定为 Z 值时,难度就会有相等单位了,就表达在等距量表上了等距量表上的项目难度被称为绝对难度。项目难度(绝对难度)转换:=13+4Z, (:项目难度或绝对难度;Z:由 P 值转换而来的标准分数)2、 项目区分度名解区分度(识记)又称项目鉴别力指数,一般用 D 表示。是指项目

37、得分对被试心理特质水平高低的区分鉴别性能,也即项目得分的高低与被试实际能力或特质水平高低的一致性程度。项目鉴别力指数的取值范围介于-1.00+1.00 之间,D 为正值称作积极区分,为负值称为消极区分(负鉴别力) ,D 为 0 称无区分作用。D0(在积极区分区域)时,D 值越大,项目鉴别力约好。项目区分度的计算:高-低分组法(二值积分法)D= PH - P L连续变量的分数从高到低排列,分成高分组合低分组,各取 27% 当 D=1.00 表示高分组被试全部通过,低分组被试全部失败;相反,如果低分组的被试全部通过,高分组的被试全部失败,则 D=-1.00,如果两组通过率相等, D=0 相关系数指

38、标:项目与总分相关;计算 项目的区分度,一般是用项目得分与测验总分的积差相关系数来求取。多值计分法:D=(XH-X L)/W=XH/ XMAX -XL/ XMAXXH:高分组的平均分 XL:低分组的平均分 W:该题目的满分求项目与总分的相关系数法:皮尔逊积差相关系数法:看笔记,不考名解项目区分度与难度的关系:项目难度会影响项目区分度,对于一份测验来讲,题目的平均难度越接近0.50,不同得分被试间相互比较的次数就越多,测验的区分鉴别力就越高测验项目的筛选评价 根据难度来筛选项目:一般要求测验项目的难度可位于 0.20.8 或 0.30.7 之间;同时所有项目的平均难度则要求在 0.5 之间。 根

39、据区分度来筛选项目:a 区分度的提高会显著地提高测验的信度和效度 b 根据下表,区分度在 0.3 以上就比较理想,但有些区分度在 0.20.3 之间的项目,如果能很好地体现测验目的,也应酌情予以保留S2 常模与发展常模1、 常模及常模在测验分数解释中的作用当前常用的心理测验都是常模参照测验,常模是这类心理测验的解释分数含义的参照体系。按照参照的是以达到的发展水平还是某团体中的相对位置,常模可以划分发展常模和团体常模测验常模(识记)简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态;实际操作中是指代表性被试样组在测验上得分的分布状况或分布形态为了能参照着常模来对分数做

40、出解释,原始分数就应该转换成导出分数。导出分数是从原始分数转换而来的,具有一定的参照点和单位的,测验量表上的数值。理解常模概念时需清楚1.常模是测验分数的总体分布形态,一般用测验分数的平均数和标准差来表示,它能对个体的分数加以解释。2.常模就是各种导出分数,由于这些导出分数具有相等的单位,所以它能比较各种不同的分数。3.常模具有相对性,只能用来解释一个测验范围内的情况。 2、常模的求取过程:取样 测试数据分析确定有关的测试团体,并从中抽取有代表性的被试样组对代表性被试样组进行合于标准化要求的测试,获得该被试团体成员在所测特质上足够而真实可靠的数据与测验分数把原始分数转化为某种形式的导出分数,制

41、作常模表并给出使用说明3、 发展常模的种类(识记):年龄常模、年级常模、顺序常模年龄常模(理解):比纳智力量表首先寻找和设计出可区分各年龄儿童智力的项目,然后将每个项目都放到合适的年龄水平中去。当每个年龄水平都有了适量的恰当项目后就可以得到一个可评价儿童智力发展水平的年龄常模量表。一个儿童在此量表上所得分数就是最能代表其智力水平的年龄。这种分数叫做智力年龄(或心理年龄) ,简称智龄年龄常模的三个基本要素:第一、一个能区分不能年龄组的项目;第二、一个由各个年龄的被试所组成的代表性常模样组;第三、一个表明答对多少项目或得多少分,及该归入那个年龄的常模表年级常模(理解):在学业成就测验中通常建立年级

42、常模,如识字测验、阅读测验、算术测验的年级常模等。就是常说的学业成就发展水平常模。它是用某年级学生在某一测验上的平均分数和相应的年级当量之间的对应关系来进行描述的测验常模。年级当量通常用两位数表示,第一位为年,第二位为月。年纪常模使用中注意事项:首先,年级常模仅仅适用于各个年级都开设的科目;其次,年级当量解释比较困难;另外,年级常模不能被误认为成绩标准;顺序常模4、 格赛尔 的儿童动作发展顺序量表 :格赛尔认为儿童行为模式出现是有一定程序的,出生后 4 周、16 周、28 周、40 周、52 周、 18 个月、24 个月、 36 个月都是行为发展的关键年龄,这些年龄阶段出现的行为可作为测查项目

43、和诊断标准。测查包括:动作能、应物能、应人能、言语能。他对儿童这 8 个年龄阶段的典型行为作了考察,按月份显示了儿童在动作、适应性、语言、社会性等 4 中主要行为领域中所达到的大致发展水平,从而建立了儿童早期行为发展的顺序模式,即格赛尔儿童动作发展顺序量表。格赛尔认为,儿童动作各发展阶段遵循一定的顺序前进,每一阶段掌握前一阶段的必要行为特征为前提。5、 发展常模的评价:(优点)发展常模用来表示个体在正常发展途径上处于怎样的水平。它以年龄或年级作为单位,容易为人所接受理解;也可以与同等团体做直接比较,并且为个人内比较与纵向比较提供了基础。 (缺点)同时也有一些不足之处,一方面由于它只适用于所测特

44、质随年龄或年级而发生系统变化的状况,因此常只适用于年龄较小的儿童;另一方面由于人的行为发展受教育与经验的影响,发展常模只适用于典型环境下的儿童S3 团体内常模及其应用1、 名解团体内常模的含义: 团体常模也称作组内常模 ,通常是根据标准化被试样组的测验分数、经过统计处理而建立起来的具有参照点和单位的测验量表2、 团体内常模的种类:百分等级常模、标准分数常模、其他导出分数常模百分等级常模(识记)它从应测试的被试团体中,抽取一个有代表性的被试样组,并把这个被试样组所有个体在某一心理测验上的原始分数,按大小顺序分为 100 个等级,并建立起原始分数与百分等级的一一对应关系。A 百分等级:一个原始分数

45、的百分等级是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。 B 百分等级是对原始分数的非线性转换;C 百分量表是一个顺序量表,数据只具有区分性和顺序性。D 百分等级是相对于特定的被试团体而言的,所以解释时不能离开特定的参照团体。名解标准分数常模(识记):就是用被试所得测验分数转换成标准分数来揭示其在常模团体中的相对地位的组内常模。Z 分数常有带有小数和出现负值,这会给使用过程带来不便。所以我们通常对 Z 分数做线性转化,使负号和小数消失,全部变为正数。线性转换公式为:T=a+bz T 分数:表示线性转化后的导出分数,a 变换分数的平均分数,b 表示变换分数的标注差

46、,Z 表示标准分数;其实就是 Z 分数的变式。T 分数:平均数为 50,标准差为 10 的分数。这一词最早由麦柯尔于 1939 年提出 韦氏智力量表各分测验的量表分:T=10+3Z 韦氏智力量表的智商离差智商:T=100+15Z 美国大学入学考试报告分数:T=500+100Z 我国四六级英语考试分数:T=500+70Z标准分数进一步线性变换为导出分数的优点:1 具有等单位特性,便于进一步的统计分析2 在正态分布下,可以利用正态分布表 将各种导出分数与百分等级作换算3 可以将几个测验上的分数做直接比较并累加求和和求总分、其他导出分数常模A 标准九分=5+2ZB 几种导出分数间的相互关系:1 标准

47、分数与百分等级之间的关系:标准分数 Z 值的大小表示被试的原始分数与他所属团体的平均分数的距离恰有Z 个标准差那么远;2 各常模导出分数的相互关系:在心理测量中,当被试群体足够大时,若所测的又是人的基本心理特质,那么,所得分数的分布形态,一般都能接近正态3、 常模的应用单选科学的合成方法:先把各分测验的原始分转换成量表分,然后再求各量表分的累加和主要方法:1、利用常模资料:在求出分测验的量表分的基础上累加求和或剖析图法2、临床诊断方法:根据直觉或经验,主观地将各种因素加权而获得结论或评定的方法3、加权求和法:包括单位加权,等量加权和差异加权。剖析图:对于有多个分测验的标准化心理量表(或成套测验

48、) ,把被试在全量表中各个分测验上的得分的总体形状表达出来,并具体说明被试各个分测验的实际表现以及彼此间相对地位的直观而形象的图形。绘制测验量表剖析图:绘出直角坐标。一般,横轴上可指定分测验,纵轴则可以进行量表取分; 分别对各分测验按量表分值在直角坐标系中描点; 将各量表的得分点连结,从而得到所有分测验分数的折线;全国常模与特殊常模多选根据样本的大小和来源,常模可分为全国常模、区域常模和特殊常模一个量表如果既有合格的地区性常模又有全国性常模,那么,使用被试适合的地区性常模来作解释,其信度和效度可能会更好些。对特殊被试的测验结果的解释,不能以普通的常模为依据特殊常模:根据特殊群体的较少而特定的范围对测验进行标准化,建立起的适合特定群体实际情况和测验目的的要求的常模。第五章 测验的信度和效度S1 测验的信度1、 信度概述定义(识记)信度就是测验抗干扰能力或者说所得结果一致性的指标 (稳定性、可靠性、一致性) (每个被试在测验工具上所获分数都可以视为由两部分构成:一真分数;二测量误差:随机误差和系统误差)信度的作用:信度是衡量一个测验质量的重要指标之一。它的作用表现在:第一,反映测量过程中所存在的随机误差的大小,能有效地评价一份测验的可靠性程度;第二,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教育教学 > 自考

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报