1、新课程背景下学生学业评价若干问题的思考与实践新课程背景下学生学业评价若干问题的思考与实践广州市教育局教研室 何琼一、必修模块学分认定中如何评价学生的学业成绩二、编制必修模块测验试题卷应该关注的几个问题三、纸笔测试中如何体现情感态度价值观的教育目标四、如何克服开放性试题的评分标准的随意性与主观性五、运用评分方法的误差分析“教学评价对历史课程的实施起着重要的导向和质量监控的作用,是历史教学过程中不可或缺的重要环节,对课程改革起着保驾护航的作用” 。一、必修模块学分认定中如何评价学生的学业成绩1.必修模块学分认定的规划学分是学生完成某科目某模块后,对学生学习的一种量化反映。学分认定既要评定学生对模块
2、内容的基础知识、基本技能的掌握程度; 评定学生在模块学习中的历史认知能力、认知方法和过程;同时也要评定学生在历史学习过程中所表现出的个性以及所付出的努力等情意过程。 从方法分类角度看,模块学分认定主要由“过程性评价”和“终结性评价”两大部分组成。 从活动形式上看,高中历史学科模块学分成绩可以由纸笔测验、开放性考试、平时表现这三大部分组成。 新课程实施初期,有人认为,只有记录下学生每节课的学习表现,每次作业的完成情况,过程性评价才称得上全面、科学。理论上这种认识是对的,但就目前我国大班制教学与教师教学任务偏重的现状下,这种过程性评价的要求是难以真正有效持续地开展的。我们只能有选择地通过一些有代表
3、性的学习任务的完成,去评定学生的过程性学习。广州市普通高中学生学业成绩评定表 (试行)就是一种反映较全面同时又便于操作的模块学分评价设计。 依据这种模式,我们设计了“广州市高中历史学科模块学分评定表” 。应该特别说明的是,开放式考试既属于终结性评价,又属于过程性评价,每一模块最少应该进行一次。进行这种考试时,应允许学生在一定的范围内确定自已的考试内容与形式。因为这不仅仅是了解学生学习过程的表现问题,更重要的是它为学生提供了一个展示自己所长的平台。对那些所谓的差生而言,这种方式可以减轻他们的负担和心理压力,让他们也有机会成为优秀者,这种考查方式的设计符合人的多元智能的实际,有利于激发学习动力和自
4、信心。2.当学生建构不一致时如何判断学习水平随着评价内容的综合化和多元化,学生学习活动走向多样化。当学生建构反应不同时,对他们的评估是困难的,因为不同类别的作品没有可比性。另外,在掌握 “学生高级心智能力及复杂技能”的评价标准上,可能会由于各方面因素的影响,会造成一些判断的“不公平” 。为降低评分的误差性,评估者首先要明确学生应达到什么样的成就标准。在实施开放式考试过程中,教师应根据学生实际情况及早制定一套便于操作的标准“量规” 。量规可以告诉评估者应在学生作品中寻找什么特征或标志,以及怎样根据事先制定的量规进行评分或评等级。 量规的制定不仅建构了一个容易使用的评分体系,使开放式考试具有可观察
5、的表现特征,降低了评分误差的可能性。更重要的是,量规的公布,实质是上向学生开放评价过程,这样有助于学生评价自己处于评价量表的什么位置并以这些标准作为自己日后努力的方向,从而更好地实现自我认识、自我教育,这里有一个巨大的潜课程空间。在强调量规作用同时,我们也应该知道,教育评价可分为绝对标准、相对标准和个体内差异标准。为了激发学生内在的需要和动机,在评价开放式考试作品时教师应结合情况适度运用个体内差异标准, “以学生自身作为参照点,将评价对象的现在与过去进行比较,或者将评价对象的若干侧面进行比较。 ”采取多元标准,允许异步达标,是激励性评价的策略,符合新课程核心理念“为了每一个学生的发展” 。由于
6、纸笔考试在信度、效度等方面有着其它评价方式不可取代的优势,所以不管在过去还是在倡导评价内容多元化,手段多样化的今天,纸笔考试仍然是学校评价学生学业成绩的常规手段与主要方法,因此,现阶段我们应该更加关注纸笔测试的形式与内容的改革。二、编制必修模块测验试题卷应该关注的几个问题1.注意把握试卷的难度由于模块终结性考试属水平性评价,目的是检查学生历史学习目标达到度,因此试题的难度要严格把握,应以课标为依据,结合本校实际情况,以大部分学生通过为原则把握好试题的难度,不能过早地按照高考难度与模式编制试题,对必修模块与选修模块的教学内容以及高三应考复习内容作整体的规划,使考试的难度在不同的时期有不同的表达,
7、既便是将来在高考中选报历史专业的学生也应该是分步达成目标。2.注意把握考试测量的基本知识内容 考试测量内容应该依据新课标是毫无疑义的。但是,由于课标教学内容表述较简略,只有学习要点,没有内容概述,而且人教版、人民版、岳麓版、大象版等高中历史各版本教材选择的内容大相径庭,因此这为把握基本知识点及测量命题带来较大的困难。如何确立基本知识点及进行测量命题?建议用以下方法处理:(1)侧重课标明确规定的,或史学界公认的重要概念、因果关系等内容来命制试题;(2)将各种版本所共有的内容确定为考试测量的基本知识点(如果测试是应对高考的模拟训练) ;(3)增大材料题的份量,不仅是论述题,选择题也可提供材料,更多
8、地设计新的情景,让学生运用平时学习培养出来的能力去解决问题。题干设问不拘泥于某一知识内容,答案可有一定的开放性。(4)改变评价标准,运用?分层评价方法?,将?采点给分根据能力层次给分?两种方相结合,灵活评价学生能力水平。3.注意把握试题题型结构不同的题型具有不同的考查功能。在试卷中按一定的比例搭配各种的题型,一方面可以全面考查学生的各种基础知识与基本技能。另一方面又能考查创造性思维的深层次的思维能力,例如材料题与图表题的设计等。再者还应该设计一些让学生能够发挥出他们长处或表现出最佳水平水的测试题目。试题设计如何反映学生长处或表现自己的最佳水平?笔者认为自选题以及能够反映学生平时历史学习过程的题
9、目,在某种程度是能够达到上述目的的。例题在本学段的历史学习任务完成过程中(或历史开放式考试过程中) ,你自认为最得意的一个作品是什么?请简单介绍这一作品的主题和内容并说明其成功的理由。在完成或创作这一作品中,你有哪些收获或认识?自选题与反映学生成功学习过程的试题设计,符合多元智力的“智能公正”理论,它是智能展示在纸笔测试的一种有效方法,它使更多的学生在传统的纸笔测试中也能体验到成功。. 注意体现三维一体的教学目标“历史教育的根本目的不仅仅在于让学生掌握基础的历史知识,更应当重视透过历史的学习,开发学生持续发展的潜力,促进其人格的不断完善” 。新课程对 “知识与能力” “情感态度和价值观” 、“
10、过程与方法”的教学目标有了更全面更具体的要求。 有人认为:为确保考试测量目标的全面实施,可以借鉴过去规定试题难易题及学科内知识各部分的比例做法,大体对“情感态度和价值观” 、 “过程与方法” “知识与能力”的三维目标作适度的规定,当然各部分所占的比例,前期应以运作的成熟度作参考依据。此番规定的目的是“避免由于命题时的随意性造成考试测量目标的遗漏” 笔者以为“情感态度和价值观” 、 “过程与方法” “知识与能力”三维一体教学目标是不能机械地分割理解。三、纸笔测试中如何体现情感态度价值观的教育目标不同维度的教学目标有极大的区别。 “知识与能力”教学目标,过去一直是各种类型的考试关注的重点问题,将它
11、转化为考试测量目标是广大教师熟悉不过的事件。而“情感态度价值观”教学目标如何转化为考查测量目标,目前在我国高中历史学科考试测量中几乎是个盲点。不少人认为情感态度价值观不能检测,因为有关的内容和要求只有一些原则性的描述,如“培养观点,树立精神、具有真挚感情”等等,缺乏可操作性;而且这类目标往往只是陈述了各种“合乎理想的品质” ,而品质结构是复杂的,其定义不明确的。在评价时,它受学生的“取悦心理” 、 “动机与行为的不统一”等多种因素的干扰,测量的效度信度受到影响。有学者将情感教育目标划分为“接受” (注意) 、 “顺应” 、 “爱好”、 “信奉” 、 “性格化”五个层次的目标。其中前三个层次的目
12、标,结合认识领域、技能领域目标的研究,其是可以反馈、调节的。而“信奉” 、 “性格化”的目标测试则不可能简单地一次达成,它需要一个量的积累过程,尔后才能有质的飞跃。因此,以事实求事的态度看,在校期间, “信奉” 、 “性格化”这两个层次的目标要求,在教育教学的评估上可以暂不考虑。我们的注意力应放在前三个层次目标上。“有做人价值的思考”“有正确价值观念的引导”“能提供一个良好心理活动的机会” 具备以上三个因素考试测量也就具备情感教育的因素。美国教育家布鲁姆曾说:“发展诸如兴趣,愿望、态度、鉴赏、价值感、义务和志愿感等特征,是教育上最重要的理想之一。 ”而情感领域前三个层次的目标正是涉及到学生的兴
13、趣、愿望、态度、鉴赏等心理状态。只有首先较好地达成这三个目标,才能为实现更高的目标打好基础。广州市中学历史学科质量抽测命题思路目前,我们着从以下几个方面入手,调整命题的思路,使纸笔测试这种传统的评价方式也能更好地反映课课程的理念。 第一,结合相关内容,在试题中渗透一定的情感因素,如做人价值的思考,正确价值观念的引导等,尽可能为学生提供一个良好心理活动的机会,努力实现寓教于考之中;第二,设计一些既考查客观史实又反映学生主观感受的与现实生活有一定联系的问题。使高中阶段学习目标中的思辨性和开放性的要求得到一定的体现;第三,注重图、表考题的设计,使学生在“分清史实与史论、有效信息与无效信息,解读图表材
14、料”等方面提高历史技能;第四,注意创设新的情景,让学生创造性地运用知识独立地解决问题,使历史考试具有促进学生渐次发展高层次能力的正确导向作用。 凭着“百分之九十九的汗水,加百分之一的灵感” ,在以下哪一领域爱迪生取得了影响深远的成就A.石油的开发和利用 B.交通运输 C.电的使用 D.电讯事业题例古语有话:“成由勤俭、败由奢” ,隋朝两任皇帝、的统治是这个道理最有说服力的例子。题例右图为“大跃进”时期的一幅漫画, 漫画反映当时存在的主要问题是:.浮夸风 . 高指标 . 瞎指挥 . 共产风题例:地理大发现极大地促进了各洲之间的物质交流,同时也引发了各洲之间的疾病大流行,但是大多数人仍认为地理大发
15、现对历史发展的影响是利大于弊。请阅读下面两则材料。 (略)根据材料说明“地理大发现对历史发展的影响利大于弊”这一观点的理由。题例:下列一组图片反映了世纪年代至年代初的美国社会景象。结合所学知识回答以下问题:(1)图片 2 图片 3 反映当时美国发生了什么重大事件?指出这一事件产生的社会原因。(2)为应对这一事件,美国政府采取什么对策?其实质是什么?(3)在社会主义现代化建设过程中,我们可以从上述案例中借鉴什么经验或 HYPERLINK “H:/新课程背景下学生学业成绩评价的若干问题 05.7/历史必修检测题().doc“ 教训 ?题例:美国 911 事件后,恐怖主义日益威胁着世界和平。如果你是
16、联合国秘书长,请结合二战期间同盟国战胜法西斯国家的经验,提出解决问题的办法。(学生答卷)题例:利用下面的材料,写一篇关于宋代东京城商业发展的文章。 (材料略)要求:题目自拟,必须涉及城市商业发展的某一个侧面。必须利用下列材料,不能够凭想象任意发挥。不能够简单地翻译材料,而要组合两道以上的材料来确定写作的主题。学生答案例举降低难度题例原题: 请论述在下列中国古代的历史时期中,我国精耕细作的技术取得了怎样的发展。春秋 汉 魏晋南北朝 隋唐 宋元 明清要求:在上述六个历史时期中,你只需要论述其中任意两个历史时期的内容;你也可以回答多个历史时期的内容,这样你会得到加分。在论述过程中,你必须举出具体的例
17、子来证明你的观点。你不能停留于单纯列举例子,而必需论述所举例子与精耕细作的关系。难度降低后的题目:汉代代田法模型代田法:是先把田地开成一条条深宽各一尺的垄和沟。第一年把庄稼种在沟里,出苗后,逐渐把垄上的草和土培到苗根上。第二年在原来的垄上,再如法开沟载种。观察阅读上面材料,指出这种农业生产技术所表现的特点是A广种薄收 B少种多收 C休耕轮作 D精耕细作三、开放性试题有什么价值?如何解决其评价的不确定性与主观性?随着新课程实施日益深入,人们对纸笔测试中的开放性试题的价值、命制方式与评分方法更加关注因为这种试题在考查学生思维的灵活性和广泛性方面,在具体的问题下考查学生知识与技能的迁移方法的应用性方
18、面;在学生情感、 态度 、价值观等非智力因素方面有着封闭性试题所无法取代的优势但是由于开放性试题的不确定性与主观性,人们感到难以把握。研究与实践过去评价的主要方法:“釆分点”评价法 “三论要素”评价法长久以来,历史学科主观题的评分方法主要是“采点给分”的方法,即根据学生答案所涉及的史实或观点的多少给分。在评卷实践中,往往把复杂的思维内容变为一种按图索骥的简单游戏,这样不仅难以判断学生思维能力的高低,而且对历史教学产生极其不好的影响,使历史教学陷入了死记背硬的误区中。近年来有人提出“三论要素”评价法,这种评价法一定程度解决了模糊评分的做法, “三论要素”评分法指的是在论点、论据、论证这“三个要素
19、”范围内,设定评价指标的层次要求,就论点是否正确清晰;论据是否充分详尽;史实与观点是否统一,论证过程是否严谨周密等不同表述给予相应的等级分值。 (见下表)但这种评价方法在思维分层的操作上仍有盲点。三论要素评价表最近从香港大学引进的分类评价法在一定程度上较好解决了思维分层的问题。分类评价法是由香港大学比格斯(Biggs)教授首倡的。 “比格斯和他的同事通过研究发现,人的认知不仅在总体上具有阶段性的特点,在对具体知识的认知过程中,也具有阶段性的特征。人在学习新知识过程中表现出来的思维阶段是可以观察到的” ,因此称为“可以观察的学习结果” (:Structure of the Observed Le
20、arning Outcome) 。这是一种以等级描述为基本特征的质性评价方法研究与实践这种分类评价法将学生学习结果由低到高分为五个不同的层次“前结构”“ 单点结构”“ 多点结构”“关联结构”“拓展抽象结构”研究与实践前结构指的是没有形成对问题的理解,回答问题逻辑混乱,或同义反复;单点结构指的是回答问题时,只能联系单一事件,找到一个线索就立即跳到结论上去;多点结构定义为回答问题时,能联系多个孤立事件,但未形成相关问题的知识网络;研究与实践研究与实践SOLO 分类评价法能够帮助教师判断学生在回答某一具体问题时的思维结构处于哪一层次,在评价上相对容易拉开学生的差距研究与实践如何运用 SOLO 评价方
21、法运用 SOLO 分类评价理论制定评分标准,能较好区分思维问题的层次高低。如果将五个层次赋予不同的等级分数,那么学生对问题回答的质量就可以被量化,量化的分数可以作为评价的依据。研究与实践运用分类评价方法,我们尝试对下面的一道历史题目进行评分近日,在朋友的化妆舞会上,英国哈里王子身着有纳粹标志的服饰哈里王子的这一装扮立即引起各国舆论的强烈谴责。澳大利亚的一名官员宣告不再效忠英女王了为什么各国对此事反响这么强烈,请结合二战相关史实作出解释。能够将二战期间,法西斯德国对内实行专制统治,对外实行侵略扩张,挑起第二次世界大战,对犹太人实行种族灭绝政策,造成欧洲多万的犹太人死于非命,给世界各国人民带来深重
22、灾难等相关史实作一个比较完整而且有序陈述的,属关联结构,可得分 结合例题分析,我们不难发现:运用 SOLO 分类评价方法的前三个层次主要考查学生识记史实的多寡,这是量的问题; 而后两个层次主要考查学生依据史实得出结论和运用理论分析结论的能力,这是从量变到质变的表现。这样学生的思维层次能得到有效区分,同时高层次的思维活动有表现的空间。运用 SOLO 分类评价理论命制历史试题具有以下特点:既保留原有得分点,又使答案有伸缩度;能准确测量个性发展倾向与水平的相对应;体现研究性学习的特点;贴近现实、彰显人文精神;能充分体现历史的广博与深刻的内涵;过去由于无法解决开放性试题的评分的客观性,因而局限了这种题
23、型的运用,当这一问题解决后, “开放性试题也能进入学业评价、特别是高利害和大规模的学业成绩评价之中” 。五、运用评分方法的误差分析一卷客观题的分值与二卷主观题的分值相关性很大。从一个考生的群体看,客观题得分高,主观题相应也高,客观题得分低,主观题相应也低,不存在两部分作答水平相游离,这样一定程度上说明主观题卷面成绩的信度较高;运用评价方法评卷,其误差率比想象中要小。通过抽样分析。我们发现,假如忽略一分的误差值,不同人评卷,左右的评分结果是趋向一致;分的误差在 左右,分的误差在 左右,分的误差不到 ;广大教师对依据评价理论命制试题及评卷方法是认同的。“运用分层评卷法是现行比较流行的做法,也符合国
24、际潮流,能够体现学生综合素质。 ”(开发区中学 肖宇宁) 。“综观全卷,立意颇高,角度新颖,能够体现新课程标准的要求,能够考察出学生的知识、能力与水平,是一套很好的历史试卷,能够对我们的历史教学起很强的指导作用。 ” (广州七中 范何勇)“我在看完试卷后,有一种非常新鲜的感觉,而且明显觉得这份试卷给历史学科带来了一次重生 , (它)赋予了历史新的生命。” (番禺市桥二中 麦秀兰) 。它让历史考试从过去的“机械性” “背诵性”转向“人文性” 、“思想性” 、 “应用性” 、 “现实性” 。当然,分层评价法的研究与运用尚在起步阶段,在评卷的操作层面上还存在不少的问题。例如:阅卷老师对一些跨几个层次
25、的问题把握不好,因此命题者要进一步考虑问题的设计与分值合理布局,考虑答案组织的方式,以便于阅卷教师的操作;又如: 许多阅卷者仍受旧的思维影响,容易跟着感觉走,进而影影到评卷的质量问题,作为教育测评部门应考虑如何通过适当的培训,帮助老师更好地掌握运用分层评价方式,使教师对评分要求的把握趋向统一。六、问题的讨论.本文提出的必修模块学分认定方案只是一种理想的必修模块学科学习成绩组合的设计。但是当我们一个老师要面对几百个学生时,或每周开四节历史课,一个学段周要完成一个必修模块学习任务时,如何进行开放式考试,如何实施过程性评价?这是需要进一步讨论的问题。 . 每一位教育工作者都清楚,高考是一种选拔性的评
26、价,是大学学位分配的方法,而高中学生学业成绩评价是水平性的评价,水平性的评价与选拔性评价目标要求是不相同的。在新课程背景下,如何处理这两种不同性质的评价关系?.有学者提出,高中学生的学业评价应包括过程性评价和终结性的测验考试,其中终结性的测验考试分为两个不同的层次,第一层次是基于课程模块的学业成绩评价,第二层次是学生毕业成绩的水平的评价,哪么这两种不同层次的评价结果如何整合?还有必修模块学分与选修模块学分如何整合?在实施新课程的过程中,我们遇到的问题有许许多多,我们不应该囿于成见,不应等待观望,应以大胆假设,小心求证的态度进行行动研究。相信在课改大潮中每一位努力者都会有所收获的。参考文献:1.
27、教育部基础教育课程改纲要(试行) 2.普通高中历史课程标准(实验)解读3.教育部关于积极推进中小学评价与考试制度改革的通知4.课程改革的理论实施与评价 广州市教育局教研室编5.广州市高中新课程实施指导意见 广州市教育局教研室编6.基础教育参考 广州市教育局教研室编7.高中学生学业评价研究资料汇编华南师范大学基础教育课程研究中心8万伟、秦德林、吴永军主编:教学评价方法与设计 ,教学科学出版社 2004 年版9朱丽、赵汉华:质性评价实施过程中存在的问题及其对策分析, 基础教育参考2003 年第 6 10.高凌飚 吴维宁:开放性试题如何评分?介绍两种质性评分方法 高中学生学业评价研究资料汇编11.
28、黄牧航:SOLO 分类评价理论与高中历史试题的命制 历史教学2004.12个别老师对恐怖主义的理解:“第 37 题把恐怖事件与法西斯相连,似乎不太准确,法西斯威胁世界人民安全,而恐怖是对个别强权国家及政权,而并非针对世界人民。 ”恐怖主义是一个全球性威胁。恐怖主义绝无正当的理由。无论出于什么目的,任何人都无权杀害无辜平民。相反,企图利用恐怖主义实现一项事业,即便是高尚的事业,结果只能玷污这项事业,从而损害这项事业。 安南2003 年 9 月 22 日 纽约“这种恐怖主义行径,不是针对某一国家的袭击,而是针对所有国家和全球文明的民族,我们决心联合起来,直面和击败这种恐怖主义。 ”八国峰会首脑联合
29、声明“恐怖分子看上去堂皇,实则偏狭邪恶的道义立场,是落后野蛮对人类文明的反动。 ” 羊城晚报2005 年 7 月 9 日题为伦敦恐怖爆炸再拉国际反恐警报?报道艾斯纳关于传统评价模式的分析:第一,从总体目的看,传统的评价模式追求的预测与控制;第二,从认识论上看,传统的评价追求的是认知兴趣;第三,从评价标准上看,传统追求一元的价值观;第四,从方式上看,传统的评价追求的是科学范式下的量化。对数量的迷恋是现代科学的基本特征之一;第五,从结果上看,传统评价重结果而轻过程;艾斯纳对新的评价概念特征的概括:第一,强调评定向生活世界的回归。用于评定学生所知与所能的作业要所反映学生在校外世界中将会遭遇到的事情,
30、而不能仅仅局限于学校内容。强调教学对真实生活的适应性。第二,强调多元价值取向。主张评定不能使用“一刀切”的标准,而应该给学生留有充分的选择余地,不仅对问题的解决可以有不同方案,而且表现自己所学的形式也可以由学生自己选择。学生真正成了学习的主人,而且也有了个性化的特点。第三,对学生进行评定的作业应该揭示学生是如何解决问题的,而不仅仅是针对他们得出的结论。第四,评定作业不必局限于单独完成,可以用小组合作的形式来共同完成。学校教育的重要功能之一,是帮助青年一代获得在成人团体中生活所必需的技巧,。第五,评定作业应要求学生展示对结构和整体的敏感性,而不是简单地感知分散的部分;*JimiSoft: Unregistered Software ONLY Convert Part Of File! Read Help To Know How To Register.*