1、第六章 教育测验的常模及其建立方法,2018/4/13,2,第一节 教育测验常模的意义与类型,原始分数(raw score):将被试的反应与标准答案相比较而获得的测验分数。原始分数本身没有多大意义。各次测验所得的“原始分数”是不宜直接比较的,更不能由此得出孰优孰劣的结论。,2018/4/13,3,为什么不能用原始分数直接比较,原始分数的两个主要缺陷原始分数的起点0是没有明确意义的学科知识测验得0分并不代表该学生一点知识都不掌握80分只能说明他在此次测验中答对了解左右的测题内容分数并不能确切说明考生对知识掌握了多少测验分数单位的大小无法固定,即不同次测验的每“1”分的价值不同。,2018/4/1
2、3,4,一、测验常模的意义,1、什么是常模测验的常模指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上的得分的分布状况与结构形式。参照测验的常模,对测验的分数进行解释与评价的测验,称为常模参照测验;参照测验的“标准”,对测验的分数进行解释与评价的测验,称为标准参照测验。,2018/4/13,5,测验的常模,(1)有代表性的样组,也称为常模团体。指的是在建立测验常模过程中实际受测被试样组,他们代表着一个有明确定义的人群。(2)测验总是用来测量人的某种身心特性的,如学科知识、记忆能力、智力人格、心理健康等。,2018/4/13,6,2、常模的用途和导出分数,常模
3、是解释测验分数的参照系导出分数(derived score):按照一定的规则,针对原始分数进行统计处理后获得的分数。导出分数具有一定参照点和单位,可以相互比较。原始分数参照体系导出分数,2018/4/13,7,三、测验常模的主要类型,发展常模年级常模年龄常模组内常模百分等级常模标准分数常模,2018/4/13,8,发展常模(Development Norm),某一年龄或某一年级心理发展的平均水平。导出分数:已经达到的发展水平。如:年龄当量、年级当量、顺序量表、比率智商、教育商数等。,2018/4/13,9,组内常模(Within-Group Norm),具有同一身份的人的平均水平。导出分数:在
4、某一特殊团体中的相对位置。如:百分位常模、标准分数常模、离差智商等。,2018/4/13,10,1、年龄常模,(1)取平均值作为指标 基于不同年龄组测试所得的平均分,并与相应的年龄当量联系起来构成年龄常模资料。(2)用一组题目作为指标用一批能使某年龄组大多被试都能通过的题目来代表该年龄组的发展水平。,2018/4/13,11,2、年级常模,(1)概念:不同年级学生在某种测验上的正常的一般的表现水平。,2018/4/13,12,2、年级常模,2018/4/13,13,2、年级常模,2018/4/13,14,第二节 百分等级常模及建立方法,一、百分数常模的意义与应用 百分等级是一个地位量数,能够反
5、映某个测验分数在一个次数据中的相对地位。它是把学生的原始分数放在学生所在群体的成绩中进行比较,以确定该学生在群体中的相对地位之高低。,2018/4/13,15,二、百分等级常模的建立方法1、基于未归类数据建立百分等级常模的方法第一步:把观测数据从大到小依次排列第二步:按不同的数据逐个地统计次数第三步:从低分开始向高分方向,计算各个得分点数据以下的累积总人数第四步:计算各得分点数据的“以下累积相对次数”即比例数第五步:确定各得分点数据的百分等级PR,计算方法是把各数据的“以下累积相对次数”乘上100第六步:把原始分数与百分等级有关数据取出来列表,形成该测验的百分等级常模表。,第二节 百分等级常模
6、及建立方法,2018/4/13,16,2018/4/13,17,某一分数 x 的百分等级的计算公式:,Fb 为小于 L 的累积频数f 为 x 所在组的频数L 为 x 所在组的下限i 为组距N 为总频数,2、基于分组归类数据建立百分等级常模的方法,2018/4/13,18,百分等级常模的优缺点,由于是等级量表,所以百分量表的分数不能进行加减乘除的运算,许多统计方法都无法使用。其优点是易于理解,用途广。,2018/4/13,19,第三节 标准分数常模及建立方法,一、标准分数的基本定义 标准分数是以标准差为单位表示测验成绩与平均分数之间的距离。标准分数是以平均数为参照点,标准差为单位的一种量表分数,
7、它将原始分与平均数的距离以标准差为单位来表示。 把原始分数转换成标准分数是一种线性的转换,所以转换后的分数能保持原始分数准确的数量关系和分布形态。,2018/4/13,20,一般标准分数,Z分数,正态分布的Z分数:平均数为0,标准差为1,-33约占总体的99.73%。,返回,2018/4/13,21,T分数,由于Z值过小,并往往带有负数和小数,通常把标准分数Z通过线性变换 T=a+bZ(1)教育与心理测验:T=50+10Z(2)美国大学入学考试报告分数:CEEB=500+100Z(3)托福考试:TOEFL=500+70Z,2018/4/13,22,二、标准分数的优缺点,标准分数的优点: 可以进
8、一步运算; 可比较两个不同测验的分数。标准分数的缺点: 计算依据比较复杂的统计原理,难以使不懂统计的人理解;有负数,应用不便,而且单位太大;原始分如果畸变,标准分不能使分布有所改进。,2018/4/13,23,三、正确理解与使用标准分数,标准分数的性质与特点()任何一批原始分数,转化成分数后,这批分数的平均值为,标准差为。(2)标准分数Z量表的单位是相等的,零点是相对的,具有较好的可比性和可加性。(3)Z分数是关于原始分数X的线性变换,Z分数不改变原始分数的分布状态。(4)标准分数Z的取值范围在-3到+3之间。Z分数的意义可以用正态分布曲线下的面积比例(本质上是概率值)做出最好的解释。,201
9、8/4/13,24,如何将原始分转化为正态Z分数?,1.根据标准化样组的测验原始分数,编制次数分布表2.根据次数分布表,计算各个原始分区间中值以下的累积比例(CP): CP =(cfL + 0.5 fi )/N cfL 为低于 x 的分数次数; f i 分数 x 的出现次数.3.根据累计比例(CP)和 标准正态分布规律, 计算区间点的Z分数:查标准正态分布表或用Excel函数计算 NORMSINV(CP),2018/4/13,25,原始分数转换为正态Z分数的过程图示,2018/4/13,26,2、正态分布下若干种评分体系之间的关系,(1)标准九分及其与百分等级和标准分数之间的关系,2018/4
10、/13,27,标准九(stanine),标准化九级分制标准九=5+2Z,即平均数为5,标准差为2,2018/4/13,28,正态Z分数与标准九的转换方法,2018/4/13,29,标准九的分布特点,返回,2018/4/13,30,正态Z分数与标准十的转换方法,2018/4/13,31,标准十的分布特点,返回,2018/4/13,32,几种导出分数间的相互关系,2018/4/13,33,第四节 标准分数在我国高考中的试点应用,一、高考中使用原始分数的局限性1、原始分数未能反映考试分数相对团体的位置信息。2、不同科目或同一科目不同次考试之间分数可比性较差。3、各科标准差不一影响对科目权重的设计。,
11、2018/4/13,34,二、高考标准分数制度的内容,第四节 标准分数在我国高考中的试点应用,2018/4/13,35,第八章 学生课业发展的测量与评价,第一节 课业考评改革的基本认识与目标 课业考评是指对学生的课程学业所取得的发展进步进行考核评价。,2018/4/13,36,一、课业考评的主要作用,合理的课业考评制度为学生发展提供较明确的目标和努力的方向。合理的课业考评制度将有助于评价学生的发展进步,从而对教与学双方活动起着重要的控制、调节和促进等作用。课业考评为学生心理发展和学习进步创造必要的背景和空间,诱发学生的学习动机和自主发展的动力。课业考评在中小学生个体社会化进程中起着控制、调节、
12、促进和加速的作用。,2018/4/13,37,二、课业考评存在着的主要问题,课业考评指导思想与学校教育理念、目标不相适应,在考试设计及考试结果的使用过程中过分强调区分和选拔功能。课业考评方法单一,把考试的教育功能简单化,考试的评定功能绝对化。课业考评抽象化和表征化,2018/4/13,38,三、国外课业考评改革的主要经验,趋势与经验之一:减少考试次数,强化课程作业,把经常性的形成性评价同若干关键年龄段所举行的校外统一考试相结合,以便在较宽松、自主的教育环境下全面落实教育目标。趋势与经验之二:无论是考试制度向来比较严格的国家,还是考试制度一贯比较宽松的国家,在中小学教育过程中,对于考试这根“弦”
13、的拨弄,基本上呈现出小学阶段宽松、初中阶段次之,高中阶段相对绷紧的趋势。趋势与经验之三:课业考评方法多元化,教学与评价整合化,尤其是表现性测验和实验技能教学考试受到高度重视与广泛采用。趋势与经验之四:学习成绩和学生素质发展的评价大量使用观察表现的等级评定量表、学生参与 评价、记录成就与成长的多功能的学习成绩报告单得到普遍重视。,2018/4/13,39,四、课业考评改革的主要目标,1、要实现考试观向发展性评价观的转变2、要努力实现从重视“掌握性结果”的评价转变到既重视“掌握性结果”又重视“发展性结果”的评价3、内容要从认知领域转变到涵盖学习结果的更广泛的教育目标领域上来4、要努力实现从表征性分
14、数机制到实质性内容机制的转变5、实质性课业考评机制强调学生个性发展与教育共性要求的统一突出课业考评的教育性、发展性、基础性、描述性、实质性和多样性。,2018/4/13,40,第二节 学生课业发展的主要内容及参照点体系,一、学生课业发展的主要内容1.学生个体一般性发展这些目标涉及到 公民素质、社会责任、环保意识、学会学习、学会生活、学会做事、学会做人、学会合作、学会思考等。2.学科理论知识和学科能力或技能的发展3.思维技能与品质的发展 思维技能有形式逻辑思维方法,包括概括、抽象、归纳、推理、想象、判断等思维过程;有发散性思维方法,其特性是创新、流畅、独特、精致等;还有批判性思维方法以及立论、证
15、据、辩驳、反例等多种思维方法。,2018/4/13,41,4、研究与学习技能5、创新精神与实践能力的发展广义的创新精神包括创新意识、创新思维习惯、创新能力等。6、态度、观念与兴趣的发展7、欣赏与审美的发展8、适应与习惯的发展9、个体独特性的发展,第二节 学生课业发展的主要内容及参照点体系,2018/4/13,42,要培养创新意识,7,怎样培养创新能力?,抛开旧的,创造新的,新意,经常的、主动的、充满激情的聊天、谈话、讨论等口头交流,与众不同,无中生有,前所未有,空前绝后,进入前缘,胡思乱想,培养兴趣,保持个性,孰能生巧,何为创新?,1/2,2018/4/13,43,二、评价学生课业发展的参照点
16、体系,参照点类型主要有个人发展参照、教育目标参照、教育常模参照。(一)评价学生课业发展进步的个人发展参照法1、个人发展纵向参照2、个人发展横向参照3、个人潜力发展参照,2018/4/13,44,(二)评价学生课业发展进步的教育目标参照法,1、专题内容领域参照2、课程目标参照3、素质教育阶段目标参照,2018/4/13,45,(三)评价学生课业发展进步的教育常模参照法,2018/4/13,46,第三节 评价学生课业发展进步的主要方法,一、客观题评价法与主观题评价法1.客观题评价法2.主观题评价法二、表现性测验评价法表现性测验(performance test)指的是客观测验以外的一类以行动、作品
17、、表演、展示、操作、写作、制作档案资料等更真实的表现来展示学生口头表达力、文字表达力、思维思考力、随机应变力、想象力、创造力、实践能力及学习成果与过程的测验。,2018/4/13,47,二、表现性测验评价法,1、口头测验2、论辩或辩论3、短文题考试4、写作测验5、过程反应题6、实验技能教学考试评价,2018/4/13,48,三、评定量表评价法,评定量表(rating scales)是用来量化观察所得印象的一种测量工具。1.评定量表的形式(1)数字等级评定量表(2)图示等级评定量表2.等级评定量表的使用(1)适用于过程评价(2)适用于成果评价(3)适用于对学生诸多方面发展的终结性评价,2018/
18、4/13,49,四、同伴评定和轶事记录评价法,1、同伴评定2、轶事记录评价方法,2018/4/13,50,五、档案袋评价法,档案袋评价(portfolio evaluation)是教师依据教学目标与计划,请学生持续一段时间主动收集、组织与省思学习成果的档案,以评定其努力、进步、成长情形的一种评价方法。,2018/4/13,51,六、动态评价法,动态评价(dynamic evaluation or assessment)其一是跨越多个时间点观察评估学生的进步与改变情形,了解学生动态认知历程与认知能力变化的特点和潜能。其二是评价者与被评价者之间产生大量的互动,强调评价与教学结合,实施个体化的诊断评
19、价与教学补救。,2018/4/13,52,七、学习能力平面图在学生课业发展评价中的应用,1、什么是学习能力平面图一组不同测验所得的数据,以共同的测量单位表达于特定的平面图上,就构成了所谓的学习能力平面图。2、学习能力平面图的若干应用(1)学生在同一学科学习进程中不同次测验成绩的比较。(2)学生同期内不同科目考试成绩的比较。(3)同一地区内的不同学校或者是同一学校内的不同班级之间的成绩比较与评价。,2018/4/13,53,第四节 成绩评定等级制的原理及应用,一、绝对评价等级制及应用1、教师综合评价法2、测量结果转换法3、核心内容参照法,2018/4/13,54,二、相对评价等级制及应用,1、五分等级制2、十分等级制,2018/4/13,55,论题,解读国家中长期教育改革和发展规划纲要(20102020年)对中等教育测量与评价的要求布卢姆的教育目标分类学在中学地理教学中的应用中学地理课堂教学评价指标体系研究中学地理教学评价中使用标准分数的可行性研究中学地理课程考核的主要内容及参照点体系研究中学地理教学中质性评价的方法中学地理考试客观题(主观题)的命制研究,