1、教育测量评价与 高考生物命题,1、教育测量评价的基本问题 2、高考命题的基本要求 3、新课程背景下高考改革方向 4、高考生物卷的命题技术 5、对高考复习的几点建议,1、教育测量评价的 基本问题,测量与教育测量 测量:利用工具从量的方面确定物体的某种(或某些)特性。,物理测量: 物理工具 直接测量心理测量: 依据一定的法则,用数字对人的心理特质(如感知、技能、能力、性格、兴趣、动机等个人特征) 进行测量、分析、评价。 教育测量: 本质上属于心理测量,是心理测量的原理和方法在教育领域的应用,即测量学生在教育影响下的心理活动。,教育测量的工具考试考试作为一种测量的类别,是根据一定的目的,按照一定的要
2、求,通过考生解答问题或解决实际问题的过程和结果,推测考生具备某一心理特征(如知识、能力)的程度。,评价的本质,顾明远主编教育大辞典增订合编本;上海教育出版社,1998, p.1188 :,“评价,指事物价值的判断”,美国A.S.雷伯 著,李伯黍等译:心理学词典上海译文出版社,1996, p.290 :,一般说来指对于某事的价值作决定,评价与教育评价,评价指的是对事物进行价值分析和判断。 教育测量是教育评价的基础,测量的结果是教育评价的依据,评价是对测量结果的解释过程;如果不依据测量结果进行价值分析和判定,测量结果就会失去意义。,教育评价的内涵,在教育的领域对教育的政策方针、管理行政、课程教学、
3、教师发展等等各个方面进行评价。 目的在于促进学生、教师和学校以至整个教育事业的发展; 以国家的教育方针政策为依据,以教育的目标为标准; 包括量和质两个方面的方法; 包括对教育过程与教育效果进行评价; 通过规范而有效的程序收集数据和资料,作出判断; 评价的结果有鉴定、诊断和导向的意义。,在比较狭义的范围内, 教育评价通常关注的是:,学校的评价 课程的评价 教材的评价 教学的评价 教师的评价 学生的评价 学习的评价,教育评价的主要功能,导向功能 引导评价对象朝着理想的目标前进 鉴定功能 认定判断对象所达到的水平和质量 改进功能 促进评价对象改进和完善其行动 调控功能 通过反馈对评价对象的活动进行调
4、节和控制,服务功能 利用评价结果为教育决策服务,评价是为决策收集系统信息的过程。 我国的大规模教育考试结果一般均用于指导考生个人做出决策。 将大规模教育考试结果作为对考生个人做出决策的依据,前提条件是考试分数应该是个人能力的标志。因此,考试分数必须可靠、有效。,两种最为重要的考试类型常模参照考试:以某一考生群体的表现为参照标准对考试分数进行解释。 标准参照考试:以某一特定的能力水平和能力领域对考试分数进行解释。 由于分数解释的标准不同,二者的设计、命题和开发的理念、原则均有所不同。 在教育考试中,往往先以不同的能力水平或不同的内容领域为参照进行命题,而对考试结果则以考生群体的表现为参照进行解释
5、。,以考生群体为标准:常模参照 以相对稳定的目标要求为标准:目标参照 从选拔的角度来看,高考是常模参照的测验;但是,高考不能脱离中学教学的基本要求,在一定程度上要以课程目标为参照。因此,不能说高考是纯的常模参照测验。,测验结果的解释,2、高考命题的基本要求,高考的理念与基本问题,高考的目的是什么? 高考的原则是什么? 高考的标准是什么? 高考由谁来实施? 高考的对象是谁? 高考的内容是什么? 高考的方法和程序怎样? 高考的结果如何解释,高考的目的是什么?,检查 情况,找出 差距,发现 问题,明确 方向,肯定 成绩,促进 发展,高考的目的非常 具体,就是为高 校选拔新生提供 依据。这实际上 是通
6、过对学生已 有基础的检查来 预测其未来发展, 让符合其发展预 期的学生进入学 校学习,最终还 是为了学生的充 分发展。,高考的原则,评价学生的素质和学习潜力 符合新课程的理念要求 三个有助于第一,有助于高校选拔新生; 第二,有助于中学实施素质教育; 第三,有助于扩大高校招生的自主权 公平公正,作为一项功利性极强的公开 考试,高考必须同时兼顾各 方的要求。这些要求从表面 上看有时是不协调、甚至是 矛盾的。因此,高考的命题 必须设法协调各方的要求, 这是对高考命题人员素质的 最大考验。,高考的标准,课程标准 考试大纲 范例样题,前述三方面的标准,第一和第二 方面规定了考试的范围,对考试 的深浅程度
7、却难以规范。第三种 比较具体,但却不是一种相对稳 定的标准。实际上,由于高考是 一种常模参照的考试,它采用的 是一种以全体考生为参照的相对 标准,没有绝对的标准要求,其 实际标准也就随考生水平的变化 而水涨船高。这是目前的高考所 存在的严重问题之一。,谁来评价?,外部评价者,上级,专家,社会,家长,教师,学校,内部评价者,学生,教师,学校,高考是一种典型的外部评价,最大优点就在 于其公平性,而最大的问题在于其有效性。 由于时间和形式的限制,高考不可能全面地 考查学生的素质。因此,怎样使得考试更有 效地、更全面地反映基本素质,是进行试卷 设计的时候需要考虑的问题。,评价什么?,情感,知识,方法,
8、技能,认知、思维、实践能力,态度,价值观,非智力品质,在目前的考试形式下,高考难以考查学生 的非智力品质,也难以考查真正联系实际、 解决问题的能力。高考可能考查的是一些 基本的知识和技能,包括思维的技能和专 业的技能,这构成了与人文和科学素养密 切相关的基本“能力”,构成了所谓创新能 力的基础,对考生的未来发展潜力有一定 的预测功能。这也是高考为大众所普遍 接受的原因。不要给高考提一些不可能 实现的要求,如:跨学科的综合能力、解 决实际问题的能力等等。因此,高考题目 设计应该围绕高中课程的基本内容和基本 要求来展开,不要随意地超纲,把高考题 变成“竞赛题”。,评价 方法,模型,标准,工具,有效
9、?,可信?,可行?,所谓模型,指的是构成该体系或过程的要素和 要素之间的关系。高考的模型是比较复杂的, 从大的方面来所,它包括了社会环境、教育导 向、中学课程、高等学校、高中学校、考生、 教师、命题人员、招生工作管理人员、等等。 如果只看命题,这以模型就要简单一些,主要 是命题人员、考生、中学课程和大学要求四个 方面。,高考主要采用书面笔试的方式,因为考试规模 非常大,控制阅卷的误差很不容易,因此试题 主要采用有唯一正确答案的题目,大量需要灵 活思考、没有唯一正确解答的试题不太可能出 现在高考试卷中。这就使高考所能考查的能力 受到很大的局限,考试效度大受影响。总体上 看,高考只能考查到学生对知
10、识的了解和理解, 以及较低层次的思维和表达能力。要提高高考 的效度,一定要打破纸笔考试的局限,打破封 闭式试题的局限。,评价的解释,以教育目标 为参照,以自身发 展为参照,以同辈 为参照,高考是一种以同辈为参照(常模参照)的 考试,这就要求我们以常模为基础进行计 分,而不是以绝对水平为基础进行计分。 当然常模参照的考试和目标参照的解释并 不是非此即彼、互不相容的两个对立面, 高考的第一需要是按考试结果对考生排队, 这时应采用常模参照的计分方法。高考的 结果又可以用来检查高中教学中存在的问 题,这时应利用水平参照的计分方法。,3、新课程背景下 高考改革的方向,高考改革与新课程改革,高考改革是否新
11、课程评价改革的一部分?,是,不是,高考必须以高中学生的课程为考试的基点,随课程的改变而改变 高考对高中教学有很强的回流作用 高考带有评价高中教学效果的成分,高考是一次社会性很强的公众考试 高考主要是为选拔高等学校新生的考试 高考有其自身的规律,不完全是,两难问题,高考改革必须与新 课程同步,高考改革不可能 完全与新课程同步,高考存在的问题,三个方面 高考的功能定位问题 高考的方式方法问题 高考结果的合理利用问题,1、将高考定位为选拔性考试,是造成试卷实际难 度逐步加大的原因。 2、单一的笔试形式造成对学生全面发展的忽视。 3、封闭式试题影响了高层次的认知能力的发展。 4、唯一的考卷加重了学生的
12、负担,不利于学生特 长的培养。 5、计分方法不合理。 6、以省为单位排总分划分数线的做法,极度夸大了考试分数的价值,负面影响极大。,六大问题,现行高考制度的正面作用,高考是世界各国普遍采取的选拔方法之一。 统一高考是新中国成立以后采取的一项重要措施,提高了行政效率,方便了考生的应考和高校的选拔。 “文化大革命”的历史教训告诉我们,取消高考带来的是高等教育的沦落和整个教育体系的崩溃。,高考有严密的规范程序和公开统一的标准,是公众心目中一块保持社会公平公正的“绿洲”,对整个社会稳定起到一种不可或替的作用。 高考为青少年学生树立了一个具体的人生奋斗目标,对青少年的成长有积极的激励作用,高考必修根据新
13、课程的理念、要求、内容和实际实施情况进行改革。 高考和应试教育没有必然的联系,不能冀望通过高考改革来消除应试教育。,新课程背景下高考改革的方向,应试教育的主要根源在于:急功近利思想的泛滥 以管理经济(生产)的方法和量化的“硬”指标来管理教育, “见物不见人”。 社会诚信普遍缺失。 教育职业道德的崩溃,高考的改革不能以全盘否定和取消高考为前提,否则会对整个社会和教育事业所带来破坏性的影响。 高考的全面深入改革,不仅是考试和招生技术的改革,更有待于社会的进步和教育的全面改革,不能幻想“毕其功于一役”。,恰如其分地估计高考制度的利弊,是高考改革成功的起点。 考试只是一种工具,有所能必有所不能,大学招
14、生不能单纯依赖考试一种方法。 高考的改革必须与招生制度的改革同时进行,或者说必须在招生制度改革的前提下进行。,高考改革的切入点,将考试分为基础考试和能力考试两部分:基础考试以考查学生对基础知识的了解和相应的基本技能为主,保证考生具有全面均衡的基础知识;能力考试着重考查学生的能力,区分学生的不同水平。 逐步减少封闭式试题的权重,增加开放式试题的权重;适当提高试题的灵活性与综合性。 加大对评分的投入和研究,逐步减少开放式试题的评分误差。,必要时可增加面试或其他的辅助考试或选拔方法。逐步实现变单一的书面笔试形式为多种不同的考试形式,以考查不同形式的能力表现。 考试科目的设置应体现新课程既保证全面基础
15、,又有利于个性特长的发展的理念。 坚持标准分的改革。,取消全省一条分数线的做法,按考生群体数划分数线,或进一步改由各学校根据报名和考试的情况自定报名的资格和录取分数线。 将高考从强调区分的常模参照考试改为强调水平的标准参照考试。,4、生物高考测试卷命题技术,教育考试的设计和开发必须考虑教育测量的特点,遵循一定的过程和方法。,考试设计和开发的基本问题:考试的目的、考试的测量目标、考试的内容领域、考试的方法或题型、试卷结构、试题背景材料选择、考试的质量指标,教育考试的目的,决定了 考试的测量目标、考试的信度、 效度等质量指标要求;决定了 如何命题以及试题的技术参数要求;决定了对考试进行评价的 基本
16、基调。,考试的内容领域和行为目标是考生复习备考的依据,是命题教师命题 的基础,也是考试效度检验的基本内容标准。考试机构在考试之前必须明确地描述考试的内容领域的范围,内容领域的结构(即内容领域不同内容的比例),以及每一内容的行为目标。,1. 高考测量目标、考试内容规范和试题规范的设计;试卷结构布局;试题背景材料的选择。 2. 客观性试题和主观性试题的编撰。 3. 试题难度、信度与效度分析,以及试题分析与评价。 4. 复习备考中如何命制检测性试卷。,高考测量目标,理论层面的目标测量目标(抽象的、不可直接测量的),操作层面的目标行为目标 (具体的,可观察的,可以测量的),对标准参照考试,还应该明确行
17、为目标的表现水平标准,即用文字概括地描述合格、不合格,甚至不同水平等级标准,明确合格与不合格的分数界线,甚至不同水平等级的分数界线。,考试的测量目标,教育考试的测量目标只能来源于课程 标准,课程标准中的分类目标是确定教育 考试行为目标的基础。,测量目标和行为目标的来源:,分析课程标准的总目标中,只有那些在特定的考试环境中可测的内容才能够作为考试的测量目标,考试测量目标的表述一般比较原则、笼统,不需要对其进行详细的描述。 课程标准中列出的分阶段目标或分类目标中,能够与确定的测量目标相联系的目标才能成为行为目标,行为目标必须是具体的、系统的,必须用反映行为类型和水平的动词对行为进行尽可能详细的描述
18、。,测量目标的表述:对测量目标的表述应该遵循五条规则:(1)考试的测量目标应该反映出考生经过一定阶段学习后,所获得的最终结果或达到的目标;行为目标应该反映考生经过一定阶段学习后,应该能展示出的行为类型;例如:用文字、图表以及数学方式等多种表达形式准确地描述生物学方面的内容;对一些简单的实验方案做出恰当的评价和修订。,(2)行为目标不需要包含具体的表现方式;一个行为目标可以有许多不同的表现方式,如“理解科学概念”这一目标可以包括以下方式:用自己的表述解释科学概念在具体的情景中确定概念的含义根据科学概念的定义区分两个相似的概念运用概念解释日常生活中的现象或事例 (3)行为目标不需要包含具体的课程内
19、容,它只需要明确作为考生达到某种标准的证据的行为类型;如在“理解科学概念”这一行为目标中不需要规定理解那些科学概念,是理解酶的概念,还是理解激素的概念等。,(4)测量目标和行为目标的表述应该以观察或测量的行为目标的动词开头,该动词应该反映出考生行为表现的类型,或者行为表现的水平。像描述、识别、区别、理解、使用等动词,都代表了可以直接观察的考生的行为表现,而像意识到、相信、增强、热爱、乐于、关注等动词,一般认为不能代表可以直接观察的考生的行为表现,应该尽量避免使用。,(5)不要同时用两个描述不同行为类型的动词来表述一个行为目标;在描述一个行为目标的表现方式时,也不要用表现不同行为水平的动词来描述
20、一个具体的行为水平。如“知道并理解科学概念”、“知道和解释科学实验原理”,这样的描述应该尽量避免。还有“解释和推断”、“能收集、选择、处理相关信息“。,考试内容规范和试题规范的设计,考试内容规范(表)和试题规范(表)是命题的基本工作文件之一。 设计考试内容规范(表)和试题规范(表),目的是为了直接指导命题教师编制出能够引导考生表现出期望的行为的试题。,考试内容规范(表)一般包括 四个方面内容:,考试的测量目标和行为目标; 考试涉及的内容领域; 题型; 题量,包括每一能力目标和内容领域的题量。,考试内容规范(表)的类型:,考试内容规范(表)设计,制作考试内容规范表一般包括以下6个步骤(1)列出考
21、试测量的行为目标; (2)列出考试的内容领域以及每一内容领域的行为特征; (3)确定每一内容领域的行为特征与考试测量的行为目标的对应关系;,(4)以考试测量的行为目标为一维,以考试的内容领域为另一维,制作考试内容规范表底表,将每一内容领域与行为目标相应的行为特征填入两个维度交叉的单元格中; (5)确定每个单元格的采样数(试题数)以及题型; (6)将每个单元格的行为特征去掉,保留试题数,如果有必要则加上题型要求和说明。,考试内容规范(表)设计,虚拟考试内容规范(表),考试内容规范检查列表,考试内容规范检查的问题,1、规范表是否包含了考试设计中所有的测量目标和行为目标? 2、规范表是否包含了考试设
22、计中所有的内容领域? 3、每一内容领域的行为特征是否都表示了出来? 4、每一内容领域的行为特征与测量的行为目标是否都一致? 5、每一单元格内是否都确定了试题数目和题型? 6、每一单元格内试题数目与课程标准中相应内容领域权重是否大致一致? 7、试题数量的分布与考试的测量目标是否一致? 8、从总体上看,规范表的试题数量分布是否会对学校教学产生不利影响?,试题规范(表)设计,试题规范表将考试内容规范表中确定的行为目标和内容领域的命题要求具体化、规范化考试机构对命题教师命题的正式的、系统的要求。 保证试题测试目标的一致性,保证试题与设计好要采样的内容领域相关,保证每个命题教师编写的试题与他人准备的试题
23、既相容,又不重复。,试题规范表包括八个方面的内容:,(1)学科 (2)考试的测量目标和行为目标、 (3)内容领域或内容要求 (4)题型 (5)题干的限制条件或要求 (6)对迷惑项的要求 (7)正确应答 (8)样题,试题规范表样例,学科:生物 测量目标:生物知识 行为目标:对生物基本概念、原理、规律的理解 内容领域: 题型:选择题、填空题、分析题 材料选择:材料可以选择考生都比较熟悉的生物现象,也可选择学术性的材料,但不要过于复杂 题干特点:试题可采用文字、图表、曲线等表示 迷惑项要求:迷惑项应该是与正确选项属于同一生物现象,或是理解过程中可能发生的错误结果,不要与分析过程完成无关。 应答特点:
24、应答可以是文字、图表等。,选择题样题: (08年高考)下列关于细胞工程的叙述,错误的是 A电刺激可诱导植物原生质体融合或动物细胞融合 B去除植物细胞壁和将动物组织分散成单个细胞均需酶处理 C小鼠骨髓瘤细胞和经抗原免疫小鼠的B淋巴细胞融合可制备单克隆抗体 D某种植物甲乙两品种的体细胞杂种与甲乙两品种杂交后代的染色体数目相同,分析题样题:,【正确答案】: (1)无机盐(1分)(其他合理答案也给分) 光(1分) 氧(1分) (2)乙 (2分)由于蓝藻等夜晚呼吸产生大量CO2,CO2 与水结合产生碳酸后使水的pH下降(2分) 大(1分) 蓝藻等白天进行光合作用释放大量氧气,使水中的含氧量上升(2分)蓝
25、藻(1分) 浮游动物(1分) 鱼(1分)(其他合理答案也给分),试卷结构布局,大规模教育考试的试卷结构与考试结果的测量误差或信度密切相关。试卷结构包括: (1)试卷的长度 (2)不同题型试题的比例 (3)不同难度试题的比例,一般教育考试在三种情况下需要 研究试卷的结构,一、在设计和开发新的考试时。 二、需要提高当前考试结果的信度,降低分数误差。 三、除了研究整个试卷的结构外,还要研究试卷各个部分的结构。,试题背景材料的选择,命题的任务:一是选择合适的试题背景材料 ,二是根据背景材料的内容设计合适的试题。 命题的要求:考生完成的思维任务必须置于一定的背景材料之中,考生通过对背景材料的理解,完成试
26、题要求的任务。 命题的问题:试题背景材料选择不当,会导致出现试题的功能偏差,降低考试的效度和信度。,为什么要对试题背景材料选择加以规定,我国地域辽阔,不同省市人文、地理以及学习、生活的物质条件都存在不同程度的差异;同一地域中,不同的家庭之间,也会存在不同程度的差异。 各省、市、自治区基础教育不均衡性很大; 考生的个人兴趣、爱好的发展是有差异的。,试题背景材料选择的基本考虑,(1)背景材料应该与考试的测量目标以及试题欲测量的行为目标相关; (2)背景材料应该与考生的学习经历和生活经历相适应;,(3)背景材料提供的信息类型;有、无新知识的信息 (4)背景材料的信息量;如果试题不是用来考查考生选择和
27、处理信息的能力,一般背景材料中不要给考生冗余或不足信息。 (5)背景材料提供的信息与应答间的关系;,(6)背景材料的呈现方式应该多样化;如文字材料、图示材料、图表材料等,增加卷面的活泼、美观,减少考生因能力偏差造成的不利。 (7)对背景材料的修改应该以正确、简明、与测量目标相关性更大和模糊材料来源为原则。对材料的修改应该尽量让考生看不出材料的原始来源,以防止材料来源部门进行不必要的炒作。,根据课程标准 对试题背景材料类型作出规定,对试题背景材料的选择作出规定时,最为困难的是材料的类型。因此,选择材料的一个基本原则就是应该贴近学生的学习经历、生活经历,在考生生活经历差别比较大的情况下,可以课程标
28、准提出的学习经历的要求为原则,选择背景材料,以最大限度地保证所选材料的公平公正。,客观性试题和主观性试题的编撰,客观题和主观题的划分主要是以阅卷方式为依据的。能用机器评判分数的 试题,称为客观题;需要人工评分的 试题,称为主观题。因此将选择题归为客观题,将填空题和简答题归为主观题,选择题的基本特征,选择题通常是由一个问题和一组备选答案组成,在很多情况下,一道或多道选择题还共有一段阅读的情景材料。 选择题的问题可以是一个直接提问,也可以是一个不完整的陈述,它们就是选择题的题干。 备选答案可以是文字、数字或符号等,备选答案中一般有一个或一个以上是正确的或最好的,它们被称为正确选项,其余的备选答案又
29、称为干扰项或迷惑项。情景材料可以是文字、图、表、符号等,含有考生应答需要的相关信息。,直接提问形式的选择题 题干是一个直接问句,多项供选答案中有一个符合题干要求的正确答案,或者是多项正确答案中有一个最佳答案。如: (06全国卷)人的神经系统中,有些神经细胞既能产生兴奋,又能合成与分泌激素,这些细胞位于( ) A大脑皮层 B垂体 C下丘脑 D脊髓,不完全陈述形式的选择题题干是一个不完全的陈述句,供选项中有一个选项的文字表述能使题干成为完整的陈述句,该选项即为正确答案或最佳答案,如: (07全国卷)切除胸腺的幼年小鼠,其免疫功能表现为A、细胞免疫缺陷、体液免疫功能下降B、细胞免疫、体液免疫功能均正
30、常C、细胞免疫缺陷、体液免疫功能正常D、细胞免疫正常、体液免疫功能下降,不完全陈述形式的选择题,(08全国卷)5人体受到某种抗原刺激后会产生记忆细胞,当其受到同种抗原的第二次刺激后 A记忆细胞的细胞周期持续时间变短,机体抗体浓度增加 B记忆细胞的细胞周期持续时间变长,机体抗体浓度增加 C记忆细胞的细胞周期持续时间变短,机体抗体浓度减少 D记忆细胞的细胞周期持续时间不变,机体抗体浓度减少,选择题的主要测量功能,1、测量考生对知识的记忆和理解 (1)测量对一般事实性知识的记忆水平题干最常用的动词“是”“属于”“有” (06全国卷)在人体中,由某些细胞合成与释放,并影响其他细胞生理功能的一组物质是
31、A信使RNA、必需氨基酸 B激素、递质 C淀粉酶、解旋酶 D肝糖元、丙酮酸,(2)测量对一般事实性知识的理解水平,(06全国卷)锄足蟾蝌蚪、雨蛙蝌蚪和蟾蜍蝌蚪均以浮游生物为食。在条件相同的四个池塘中,每池放养等量的三种蝌蚪,各池蝌蚪总数相同。再分别在四个池塘中放人不同数量的捕食者水螈。一段时间后,三种蝌蚪数量变化结果如图。下列分析,错误的是 A无水螈的池塘中,锄足蟾蝌蚪数量为J型增长 B三种蝌蚪之间为竞争关系 C水螈更喜捕食锄足蟾蝌蚪 D水螈改变了三种蝌蚪间相互作用的结果,(06全国卷)(分析判断)下列关于动物细胞培养的叙述,正确的是A培养中的人效应T细胞能产生单克隆抗体B培养中的人B细胞能够
32、无限地增殖C人的成熟红细胞经过培养能形成细胞株D用胰蛋白酶处理肝组织可获得单个肝细胞 (06全国卷)(解释因果)人被生锈的铁钉扎破脚后,应该尽快注射破伤风抗毒素,其原因是破伤风抗毒素能够 A促进自身免疫反应 B增强细胞免疫作用 C使体内产生抗原 D特异性地中和外毒素,2、测量对基本原理的理解和应用能力,3、测量基本技能的掌握水平,(06全国卷)(读图能力)一般情况下,用抗原免疫机体,血清中抗体浓度会发生相应变化。如果第二次免疫与第一次免疫所用的抗原相同且剂量相等,下列四图中能正确表示血清中抗体浓度变化的是,4、测量辨别、选择、使用和评价 过程或方法的能力,(08全国卷)(使用过程或方法)为了验
33、证胰岛素具有降低血糖含量的作用,在设计实验方案时,如果以正常小鼠每次注射药物前后小鼠症状的变化为观察指标,则下列对实验组小鼠注射药物的顺序,正确的是 A先注射胰岛素溶液,后注射葡萄糖溶液 B先注射胰岛素溶液,再注射胰岛素溶液 C先注射胰岛素溶液,后注射生理盐水 D先注射生理盐水,后注射胰岛素溶液,选择题的优缺点,选择题的基本优点是 1、应答一般不受考生应答倾向的影响,如果考生不知道答案,一般不会选择某一特定的选项; 2、干扰项的使用,使得考试结果具有一定的诊断功能,考生对错误选项的选择,可以揭示出其对问题理解上的错误,或者揭示出学校教学上存在的问题; 3、测试结果的信度比较高。,选择题的优点,
34、与匹配题相比,它不需要同质性的材料; 与是非题相比,选择题的可猜测性低得多; 与填空题相比,选择题产生歧义和意义不明确的概率要低得多。,选择题的主要局限性,选择题测量的是考生“纸上谈兵”的能力,即知道要做什么,而不是一定能够做什么; 它不太适合测量考生解决问题的实际能力,也不太适合测量考生的思想、观点的组织能力和表述能力; 选择题的迷惑项设计往往比较困难。设计干扰项的基本要求是:干扰项应该似是而非,不能迷惑真正掌握了的学生,而要将没有真正理解的学生迷惑倒。,选择题的编制注意事项,1、思考性、干扰性和答案的惟一性相统一2、备选项有意义,无歧义、无重叠、无暗示 3、各试题的题干和备选项之间、各试题
35、之间不能有暗示4、赋分与难度协调合理,编撰选择题的基本要求,1、题干本身应该有意义,并以明确的问题形式呈现; 编撰选择题时应该保证题干中包含一个明确的问题,这个问题即使在没有备选项的情况下也有意义,同时,备选项具有较好的同质性,以降低可能的猜测概率。 例:如果一个人事物有1/2来自植物,1/4来自小型肉食动物,1/4来自羊肉,假如传递效率为10%,那么该人每增加1千克体重,约消耗植物 A、10千克 B、28千克 C、100千克 D、280千克,2、题干中不要包括无关的内容,选项中相同的内容应尽可能置于题干中;,例如:某成年女性因患病导致性周期停止,并出现泌乳现象,据此推断 A、发生病变的部位是
36、胸腺 B、发生病变的部位是垂体 C、发生病变的部位是卵巢 D、发生病变的部位是乳腺,例如:某成年女性因患病导致性周期 停止,并出现泌乳现象,据此推断, 发生病变的部位是 A、胸腺 B、垂体 C、卵巢 D、乳腺,3、应答所要求的思维过程不要过于复杂;,所有的客观题都是通过考生思维的结果,对考生的能力或思维品质进行测量,如果思维过程过于复杂,则考生应答错误时,很难判断究竟是在哪个环节上出现了问题。如果我们主要考查的是考生分析问题的能力,而过于复杂的计算可能导致粗心的考生出错,结果导致对考生分析能力作出不正确的判断。,4、所有的干扰项都应该似是而非;,(08全国卷)某水池有浮游动物和藻类两个种群,其
37、种群密度随时间变化的趋势如图。若向水池中投放大量专食浮游动物的某种鱼(丙),一段时间后,该水池甲、乙、丙三个种群中仅剩一个种群。下列关于该水池中上述三个种群关系及变化的叙述,正确的是 A甲和丙既有竞争关系又有捕食关系,最终仅剩下甲种群 B甲和乙既有竞争关系又有捕食关系,最终仅剩下丙种群 C丙和乙既有竞争关系又有捕食关系,最终仅剩下甲种群 D丙和乙既有竞争关系又有捕食关系,最终仅剩下丙种群,编制好的迷惑项的某些方法,用学生经常或易于犯的错误作为迷惑项 迷惑项尽可能与题干某些部分相关,使得每个迷惑项看起来都是可能的。 利用教材上的语言或真理性措辞作为迷惑项 尽可能使迷惑项与正确选项保持同质或相似
38、所有选项在形式上与题干保持平行,语法上与题干保持一致。如都是短语或句子等。 所有选项本身在长度、结构和内容复杂程度上基本一致或相似。,5、避免题干与正确选项之间存在语言联系,以免阅读能力比较强的考生从中获得有用的线索; 6、使正确应答随机分布在选项中,以防止考生觉察出正确选项的分布规律。,选择题的编制注意事项,1思考性、干扰性和答案的惟一性相统一2备选项有意义,无歧义、无重叠、无暗示 3各试题的题干和备选项之间、各试题之间不能有暗示4赋分与难度协调合理,主观题的编撰,主观题的主要类型: 填空题、简答题、材料分析题、问答题、小论文题,主观题经常测量的行为目标,(1)辨认或汲取相关信息的能力和表达
39、相关信息的能力;(2)分析归纳或分析说明材料的能力,包括文字、图表、数据和关系材料;(3)解释各种关系的能力;(4)应用概念或原理解决问题的能力;,(5)提出、组织和表达观点的能力或用事实、资料支持观点的能力; (6)陈述推理的能力; (7)设计实验或调查程序的能力: (8)提出假设的能力以及对资料进行分析支持或驳斥假设的能力; (9)对论点或观点进行评价的能力。,填空题的格式是一个预留着若干空白的不完整陈述句,要求考生根据题意在空白处填写某个概念、术语、数字、符号等,从而使其格式成为一个完整而确切的句式。 填充题的格式中预留的空白较长,要求考生填写某个短句使上下文成为符合题意的句式。 近年来
40、的非选择题有多个设问,其中有的为填空或简答。如:,填空题的基本特征,(08全国卷)30回答下列、小题: 图中A、B曲线分别表示在适宜的条件下,一定时间内某一必需矿质元素从大麦幼根不同部位向茎叶的输出量和在大麦幼根相应部位积累量的变化。请回答: (1)只依据B曲线 (能、不能)确定幼根2060mm部位对该矿质元素的吸收量,理由是,该部位对矿质元素的吸收量等于输出量与积累量之和,只考虑B曲线只能得到积累量的数据,积累量不等于吸收量 。,(2)一般情况下,土壤中该矿质元素的浓度比根细胞中的浓度低 ,所以幼根表皮细胞通过主动运输方式吸收土壤中的矿质元素。缺氧条件下,根对该矿质元素的吸收量减少 ,原因是
41、主动运输需要能量,缺氧时根细胞呼吸作用降低,产生能量减少 。 (3)若大麦吸收该矿质元素不足,老叶首先表现缺乏该矿质元素的症状,说明该矿质元素 (能、不能)被植物体再度利用。在不同的生长发育时期,大麦对该矿质歹毒的需要量 (相同、不同)。 (4)该大麦幼根大量吸收该矿质元素的部位与大量吸收其他矿质元素的部位 (相同、不同),该部位称为成熟区。,填空题的测试功能,填空题可测量考生对陈述性知识的了解和识记,对概念的简单理解及记忆,对图形图象的了解和掌握,解决数量问题的能力等,也可考查分析推理和计算类的问题。,填空题的优缺点,填空题的主要优点是阅卷简便、准确、效率高,考查点比较集中,设问方式灵活,可
42、以有一定程度的开放性,可以考查简单的表述能力,考查的能力范围比较广,从简单的记忆到高层次的推理分析、综合、作图、表达能力都可以。该题型的主要缺点是只有结论,看不出解答的思路和过程,只有全对或全错两种结果,影响试题的区分度,试题编制要求比较高,问题要十分明确,以免引起歧义。,编撰填空题的基本要求,设计填空题时应做到:预留空白而要求学生填写的部分,必须是简明而重要的概念,且与上下文联系密切;避免从课本上抄录整个句子;使各填充部分预留的空白有一样的长度,以避免产生暗示;每一题目不宜有多个填充,如果填充太多,容易把内容割裂得过于零散,考生不容易找到应填的内容;通常空格不在句首。,简答题的基本特征,简答
43、题由一个问句或陈述句构成,要求学生用文字、图表、符号、观点及结论等方式回答问题。它要求考生自己立意、选材、组织与表达,比较适合测量学生综合运用知识、组织材料以及表达等方面的能力。,简答题的测试功能,简答题可以测量记忆及简单理解。可考查术语知识、特定事实知识、原则的知识、方法和程序的知识;还可考查简单解释资料或使用数字符号的技能。,简答题的优缺点,这类题目对过程不进行考查,或这类题目所考查的过程很容易被分解。简答题考查的能力表现行为比较单一,涉及到的内容领域相对较单一,内容范围相对较小,这类题目在考查考生用语言表达问题方面有其独到之处,但准确把握评分标准较难,评分难度较大,相对来说误差也会大一些
44、,在一定程度上会影响考试的公正性。,设计简答题的基本要领,设计简答题时要注意,题意用语必须清楚明确,尽量采用疑问句出题;应测量学科知识的重要概念;不可按书原文抄题;试题数量必须与学生答题时间相配合;制定的标准答案唯一,且简单具体;评分标准也要明确,不能含糊不清。,材料分析题的题型特征,材料分析题一般也叫问题情境测验题。 它的特点是先用一段文字,或一些图表设置一个具体情景,然后针对所设置的情境,编制一些试题,这些试题可以是选择、填空、问答和计算等,这种试题要求考生首先要读懂材料、看懂图表所含的信息,然后再结合自己所学的知识回答问题。,(06全国卷) 31(20分)从一个自然果蝇种群中选出一部分未
45、交配过的灰身和黄身果蝇。这两种体色的果蝇数量相等,每种体色果蝇雌雄各半。已知灰身和黄身这对相对性状受一对等位基因控制,所有果蝇均能正常生活,其性状分离符合遗传的基本定律 请回答下列问题: 种群中的个体通过繁殖将各自的基因传递给后代 确定某性状由细胞核基因决定,还是由细胞质基因决定,可采用的杂交方法是正交和反交,如果控制体色的基因位于常染色体上,则自然果蝇种群中控制体色的基因型有3种;如果控制体色的基因位于X染色体上,则种群中控制体色的基因型有5种 现用两个杂交组合:灰身雌蝇黄身雄蝇、黄身雌蝇灰身雄蝇,只做一次杂交试验,每个杂交组合选用多对果蝇。推测两个杂交组合的子一代可能出现的性状,并以此为依
46、据,对哪种体色为显性性状,以及控制体色基因位于X染色体上还是常染色体上这两个问题,作出相应的推断。,(要求:只写出子一代的性状表现和相应推断的结论) 答案概括如下:,材料分析题的测试功能,材料分析题有利于测量考生对陈述性知识的理解,对程序性知识的掌握和运用能力,测量计算技能和科学推理,以及运用知识到新情境中的能力,考查学生阅读、理解、分析和应用问题等多方面的能力。,材料分析题,优点:有利于测量学生阅读、理解、应用等多方面的能力。 缺点:材料占据的版面过大,靠生阅读理解花费时间较长。 材料分析题是高考中常用的试题。 如联系生产生活和社会热点的材料分析题,识图作答题等。,设计材料分析题的基本要领,
47、设计材料分析题时挑选的材料应该与学生学习经历过的材料有类似性或是全新的材料,用清晰、明确的语言表述背景材料和问题;设计的试题应该基于对材料进行分析和解释;设计的试题数应该与背景材料的长度相匹配;对试题应该进行合理赋分;对每个问题给以适当的完成时间。,实验设计题的题型特征,通过一段陈述性文字创设一个特定的实验情景,提出与此实验情景有关的问题,要求学生运用学科的知识解决问题,如提出实验假设,作出实验预期,写出实验设计方案,对已经得出的实验数据进行分析,得出结论,或者对已经完成的实验进行评价然后修正。此类试题的答案往往不是唯一的,可以有多样的解决思路和方法。,实验设计题的测试功能,实验设计题有利于测
48、量考生的设计、论证和表述能力,如设计实验或调查程序的能力,提出假设的能力以及对资料进行分析支持或驳斥假设的能力,对论点或观点进行评价的能力;对考查学生实践能力和创新能力有优势,高考中常用实验设计题来考查学生的科学素质。,实验设计题的优缺点,实验设计题的主要优点是有利于学生创造性和独立思考能力的发挥,思路开阔,可以考查深层次的思维能力和解决问题能力,容易联系实际,联系生活,不受回答方式和唯一正确答案的限制。其主要缺点是阅卷困难,评分主观误差大,回答耗时,题量和覆盖面受限制。,设计该题型的基本要领,首先要考虑素材的选取问题 其次设置合理的试题情境 最后在思维层面上考查学生科学探究能力,常见题型的比
49、较,关于答案及评分标准的制定,制定主观题评分标准是编制主观题最重要的环节之一。保证单项选择题的答案的惟一性。选择题以外的客观题的答案要明确、具体,如果答案存在争议则不应作为试题;主观性试题要制定清晰的评分标准,具有可操作性;要从试题本身和学生的角度出发,充分估计到各种可能出现的情况,给出具有明确层次的内容标准,必要时可以给出不同层次的样例,以控制评分误差;答案及评分标准与题目要求要保持一致。,试题分析与评价,经典的考试理论要确定试题的特征、试题分数与考试总分之间的关系,以及试题之间的关系。这些关系分析称为试题分析。 试题分析可以采用多种不同的方法。考试类型不同,依据的教育测量理论不同,试题分析的方法和结果也可能有不同。 对常模参照考试而言,难度和区分度是衡量试题质量高低的主要技术指标。,试题及试卷难度,命题要预测的评价指标,通过率( P=R/N )或得分率( P=X/W),得分率,某一试题i的难度系数Pi为:PiXi/Ai;其中Xi为试题i的平均得分;Ai为试题i的满分值。 相应地整个试卷的难度系数为P, P=Y/A,式中y为考试的平均分;A为试卷的满分值。,