1、1如何用线性回归分析和水平测试成绩估计学生高考成绩评价学生和学校的进步情况“普通高中新课程学生学业成绩评价研究”项目组从 2005 年开始,教育部“普通高中新课程学生学业成绩评价研究”项目组开始高中必修课学业水平测试的研究活动。作为高中必修课的学业水平测试,具有三个方面的功能:第一,检查学生经过必修课学习后达到的水平,帮助学生建构学科知识结构;第二,诊断教学中存在的问题,为教师搞好选修阶段的教学以及高考复习做准备;第三,预测学生在高考中可能达到的成绩水平。前两方面的功能是显而易见的,我们通过每年测试后的信息反馈和分析报告,已经做了这项工作。第三项工作是大家所关心的,然而要如何做才能达到呢?通过
2、回归分析,我们可以计算出每一位同学、每一间学校从必修课水平测试到高考这段时间内的进步情况,建立起高考与水平测试之间的关系模型,进而粗略地预计新参加水平测试的学生将来参加高考可能达到的成绩区间。下面简单介绍线性回归分析的方法和如何解读数据的方法。1、 线性回归分析线性回归是利用线性方程来模拟表示两组相关数据之间的关系的方法。如果两组相关数据,比如说,必修课水平测试与高考成绩之间存在着相关关系,这种关系可以近似地用一个线性方程来表达,即高考的成绩 与水平测试的成绩 之间的关系可以表示为: ,其中 a 和 b高 考y水 平x axy水 平高 考为两个常数,通过统计分析可以把这两个常数找出来。这样对应
3、于每一个 水 平 的值,就可以找到相应的 值,即可以用这一关系来预测高考的期望成绩。高 考y由于新课程实施后的高考是以必修课的内容为主要的测试对象,学生经过必修课的学习基本上奠定了高考的知识基础,掌握了相关学科的基本能力,又因为我们的测试题目的目标要求与高考的目标要求在本质上是一致的,必修课水平测试的成绩与高考成绩应该存在着高度相关的关系。我们的研究也证实了这种关系的存在。在 2005 年,佛山市顺德区和禅城区的高二学生参与了我们的必修课水平测试,在 2007 年他们又参加了高考。根据这些考生两次考试的成绩,我们计算得到两次测试的语文科相关系数为 0.454,数学科(文)的相关系数为 0.42
4、9,数学科(理)的相关系数为 0.450,英语科2的相关系数为 0.608,语数英三科总分(文)的相关系数为 0.680,语数英三科总分(理)的相关系数为 0.693。由于高考是在必修课水平测试施测一年后才进行的,因而上述相关系数都是比较可观的,尤其是语数英三科总分(理)的相关系数高达 0.693。因此,通过统计分析确定上述回归方程是可能的。以下以英语学科为例来具体说明如何运用线性回归分析来估计学生高考可能达到的成绩。2、 利用回归直线与回归方程估计高考成绩在研究 05 年必修课水平测试和 07 年英语高考成绩的关系时,以横坐标和纵坐标分别表示各考生必修课水平测试中英语成绩和高考英语成绩画点(
5、见图 1)。我们发现,这些点均匀地分散在图中的红色线周围。红色线基本展示了必修课水平测试中英语成绩和高考英语成绩的关系,我们称之为两者的回归直线。回归直线对应的线性方程称为回归方程,下图红色线对应的回归方程为:37.887+0.790 。高 考y水 平x图 1:05 年必修水平测试与 07 年高考 英语科 回归图线我们可以利用回归方程来预测高考的期望成绩。例如,在 05 年的必修课水平测试中,张恒源同学的英语成绩是 25 分。由回归方程 高 考y37.89+0.79 我们可以得到其英语高考成绩期望值为水 平x57.64 分。不过,由于在必修课水平测试与高考之间,学生还要经过一年多的选修课学习以
6、及高考复习。在这段时间内的许多因素,如:学生本身的努力程度,学生的学习方式,教师的教学水平和教学方法等等,都会对学生的高考成绩产生影响,水平测试成绩与高考成绩之间的关系不可能是简单的线性关系,由线性方程 baxy水 平高 考 计算得到的 高 考y跟考生高考的实际成绩未必一致。加上水平测试和高考3本身都存在测量误差,因此需要在回归方程的基础上加一个反映估计误差的区间,以此来估计学生的高考可能达到的成绩。在回归分析中,有一个概念“估计标准误”S,就是用来表示估计误差的。当统计数据正态分布时,考生高考的实际成绩落在区间 高 考yS, S 的概率是 68,而落在区间高 考1.9S, 1.9S的概率是
7、95。一般的,我们采取 S, S作为高考成绩的期高 考y高 考y 高 考 高 考y望区间。当然,用这样的方式来估计学生的成绩不可能是非常精确的,但是也可以让学生和教师明确自己的努力方向,可以判断学生和学校的进步情况,从而为评价学校的教学和学生的学习提供依据。在上例中,由 SPSS 计算可得估计标准误为 17.21。由于张恒源同学的英语高考成绩期望值为57.64 分,所以他的英语高考成绩的期望区间为17.21 57.64,17.2157.64 ,即40.43,74.85。由于高考的延续性和考生总体水平的相对稳定性,我们可以利用 0507 年的回归分析结果,预测 06 年参加水平测试的学生在 08
8、 年参加高考时可能得到的成绩。比如说,06 年有一位考生的英语水平测试成绩和张恒源一样是 25 分,可以粗略地预测他 08 年参加高考的英语成绩可能在 4075 分之间。经过我们对 05 年参加必修课水平测试、07 年参加高考的考生的数据进行回归分析,我们得到的回归方程如表 1 所示。表 1:05 年必修水平测试与 07 年高考回归分析数据表科目 语文 数学(文) 数学(理) 英语 三科总分(文) 三科总分(理)匹配的考生数 8927 4370 3821 8531 3589 3459匹配的学校数 20 19 19 20 17 17相关系数 0.454 0.429 0.450 0.608 0.6
9、80 0.693回归方程 Y63.03+0.43X Y60.62 +0. 59X Y55.58 +0. 52X Y37.89+0.79X Y100.92 +0. 90X Y94.35 +0.88 X 估计标准误 10.94 22.66 18.81 17.21 35.77 33.713、 进步值用回归分析来预测高考的期望成绩,得到的是一个以期望值为中值、标准误为幅度的区间。如图1 所示,两条蓝色线分别为方程 y 高 考 +S 和 y 高 考 S 对应的直线。这两条蓝色线分别表示期望区间的上下界。当表示考生两次成绩的点落在两条蓝色线之间时,则认为他正常发挥,该考生的进步值为“0” ;如果他的实际成
10、绩超过区间上界,即在表示上限的蓝线的上方,则认为他进步了,进步值高考实际成绩区间上界;如果他的实际成绩比区间下界还少,即在表示下限的蓝线的下方,则认为他退步了,进步值高考实际成绩区间下界。图 2 给出每位同学的水平测试成绩、高考成绩期望区间和进步值的情况。从图 2 中可见,在 07年的高考中,张恒源同学英语高考的实际成绩为 32 分,比区间下界还少,所以他的进步值高考实际成绩区间下界3240.438.43。又如,蔡淑意同学水平测试的成绩为 27.50,高考英语成绩4的期望区间为42.41,76.83,她高考的实际成绩为 44 分,落在期望区间 ,她的进步值为 0。再如,黄冠鹏同学水平测试的成绩
11、为 37.00,高考英语成绩的期望区间为49.92,84.34 ,他高考的实际成绩为 101 分,超出了期望区间的上界,因而他的进步值高考实际成绩区间上界10184.3416.66.。图 2:05 年必修课水平测试与 07 年高考英语成绩期望区间与进步值4、 学校教学质量监控按如上方法可以计算出各个考生的英语高考成绩期望值、期望区间以及进步值。进而可以计算出各学校进步值的平均数和标准差,从而对各校的进步值进行排名(见表 2),并以此为依据来分析各个学校的教学质量,实现对学校教学质量的监控等。例如,由表 2 可见,学校 F 在 05 年的必修课水平测试中排名最后,可是在 07 年的高考中却提高了
12、 5 名,名列 15,其进步值的平均值为 6.32,在所有学校中名列第一。这在一定程度上表明,虽然在必修课水平测试时,该校考生水平较差。然而在必修课水平测试到高考这一年多的教学中,该校的教学质量却很好,从总体上学生获得较大的提高。学校 G 和学校 H,在水平测试时的成绩分别排名第二和第一,但是其高考平均进步值的排名却倒过来为第九和第十,说明学校 G 的进步更大一些。表 2:05 年必修水平测试与 07 年高考回归分析 英语学科数据表2005 年必修测试 2007 年高考 进步值学校名称(共 20 校)匹配的考生数 平均分 排名 平均分 排名 平均数 标准差 排名A 752 56.78 17 9
13、2.80 6 3.70 8.58 3B 940 66.05 7 95.00 5 2.49 8.67 6C 391 62.10 11 88.59 8 1.44 7.23 7D 315 59.80 15 89.14 7 3.81 10.10 2E 171 49.03 19 79.63 16 3.32 11.21 4F 407 40.83 20 79.64 15 6.32 13.88 1G 323 81.07 2 111.71 2 0.99 2.55 9H 336 83.99 1 107.32 3 0.16 3.37 10I 299 69.44 4 103.33 4 1.23 3.24 8J 475
14、 64.98 9 84.12 10 -1.10 4.05 14K 292 55.20 18 73.72 20 -1.45 4.09 16L 277 61.21 13 80.24 14 -1.01 3.57 135、小结利用线性回归分析得出的回归方程和标准误,可以估计下一年度参加水平测试的学生可能达到的5高考成绩区间;同时也可以回过头来确认已经参加高考的这一届学生和学校的进步情况,为监控学校教学质量作出依据。6附表:一、06 年参加水平测试的学生 08 年高考语数英总分期望表二、06 年参加水平测试的学生 08 年高考语文成绩期望表三、06 年参加水平测试的学生 08 年高考数学成绩期望表四、06 年参加水平测试的学生 08 年高考英语成绩期望表五、05 年必修水平测试与 07 年高考回归分析 各校进步值六、05 年必修水平测试与 07 年高考回归分析 语数英总分数据表七、05 年必修水平测试与 07 年高考回归分析 语文科数据表八、05 年必修水平测试与 07 年高考回归分析 数学科数据表九、05 年必修水平测试与 07 年高考回归分析 英语科数据表