收藏 分享(赏)

第七章_语言测试.ppt

上传人:hyngb9260 文档编号:8159886 上传时间:2019-06-11 格式:PPT 页数:31 大小:400KB
下载 相关 举报
第七章_语言测试.ppt_第1页
第1页 / 共31页
第七章_语言测试.ppt_第2页
第2页 / 共31页
第七章_语言测试.ppt_第3页
第3页 / 共31页
第七章_语言测试.ppt_第4页
第4页 / 共31页
第七章_语言测试.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、语言测试,第一节 概说:发展、作用、学科特点 第二节 语言测试基本类型 第三节 语言测验开发过程 第四节 题目编写和分析方法 第五节 质量评估:信度和效度,语言测试,第一节 概说 1、语言测试主要发展阶段: (1)传统时期或前科学时期(20世纪初-50年代初):依靠直觉判断。作文、口试、翻译等方法。 (2)心理测量-结构主义时期或科学时期(50年代末60年代初-70年代):以结构主义语言学、行为主义心理学、心理测量学为基础, Robert Lado 语言测试外语测验的开发与使用(1961)为标志。主要是分立式测试。,(3)心理语言学社会语言学时期或后现代时期(70年代-80年代初):注意功能性

2、社会性和语言应用。综合式测试,出现完型填空(Cloze Test)等形式。 (4)交际法语言测试时期(80年代初至今):ACTFL 和欧洲功能意念大纲、交际大纲为基础。Bachman的“语言交际能力模型”。,2、中国的语言测试: (1)中国是最早使用考试(西周)。 (2)科举是一个标准化程度很高的测试体系。 (3)70年代末受TOEFL等影响开始第二语言测试,出现“英语水平考试(EPT)”“大学英语考试(CET)”。 (4)对外汉语教学界“汉语水平考试(HSK)”影响广泛。,3、语言测试作用: (1)一般作用:评价学习者的学业成就和语言水平。评估教学的实际效果。为选拔人才提供依据。为改进教学中

3、的问题提供反馈。 (2)对于各种有关人的语言能力的假说,需要实证性数据的证实,语言测试在这方面可以为语言研究(语言教学研究)提供信息,发挥重要作用。 (3)语言测试研究能够为第二语言习得研究提供更为可靠而有效的方法和手段。,4、学科特点: (1)理论与实践结合非常紧密。 (2)综合性很强:应用语言学(语言学、语言教学)、认知科学、心理测量学、教育统计学、信息科学。,第二节 语言测试基本类型,一、从用途的角度分: 1、成绩测验特点:教什么测什么,学什么测什么,怎么教怎么测。测试内容必须以教学大纲、教材、教学内容为依据。典型的成绩测验:期中、期末测验分类:最后成绩测验;进步测验,2、水平测验特点:

4、不以特定的教学大纲、教学课程或 教学方法为依据,只看被试的语言水平如何。目的:测试对目的语运用的熟练程度,选拔人才。难点:必须弄准什么叫“语言水平”、要求能够预测未来完成特定任务情况。,3、能力倾向测验目的:预测被试学习目的语的能力。难点:必须弄准什么是“能力倾向”,Carrol等人认为包括:语音能力、语法能力、综合归纳能力、语言记忆能力、语言表达能力等。 4、诊断性测验特点:学什么考什么,教什么考什么目的:了解学习者对教学内容掌握情况,以便调整教学。不一定需要打分,非正式的测验。,5、安置性测验目的:妥善地将学习者按程度分班或编组。特点:最好以本单位教学大纲或可能开设的课程内容为依据。 各种

5、用途测验又互相联系:水平测验也可以安置学习者,成绩测验可以诊断教学问题。但各种测验用途有区别,基本特性也有区别。,各类测验的特点,二、从评分方法的不同分类: 1、 主观性测验划分标准:根据评分时是否需要凭主观判断。形式:作文、口试、问答、简述、完成句子、完成会话、造句、翻译优点:考查有深度和层次;命题容易;很难猜测缺点:评分不易做到完全一致;评分费时费力,2、 客观性测试划分标准:根据评分时是否需要凭主观判断。形式:选择题、是非判断题、配伍题(如连线)听写、填空是不是客观题优点:题量大,内容覆盖面广;评分简单、客观;容易满足统计学的要求。缺点:不适合测试产出性语言技能和被试综合运用语言能力;可

6、以猜题;编题费时费力。,三、分立式测验和综合式测验,1、分立式测验 特点:把语言分解成语音、语法、词汇等不同的语言点来测。 形式:多项选择、是非判断等题型。 优点:评分客观、准确;试题针对性强。 2、综合性测验 目的:了解被试综合运用语言知识的能力。 形式:写作、口试、完形填空、听写、多项选择的阅读听力理解。 优点:有效测量被试整体语言水平。,四、标准化测验非标准化测验,1、Standardized Tests特点:一是具有统一的标准,二是对整个测试过程可能出现的误差都可严格监控(试题编制、测验实施、阅卷评分、分数转化解释四个标准化)缺点:忽视不同个体习得第二语言特点,客观性多项选择题能否测量

7、真实语言水平受到怀疑,对语言教学产生误导。 2、Non-standardized Tests:表现评价;真实评价,第三节 语言测验开发过程,一、设计阶段 (1)明确测验目的:语言教育;选拔人才;改进教学 (2)明确测验对象:背景:个人特征;知识结构;语言水平;对测验的熟悉程度需求:求学;求职 (3)确定测验内容:教学内容;非教学内容,(4)确定测验方式和卷面构成:题型;题量汉语水平考试的题量和时间分布,(5)确定评分方式和分数体系:主观题的评分标准和分值(模拟),二、操作化阶段 (1)编写测验说明和题目细则:P306 (2)训练命题员 (3)聘请专家就有关问题向其咨询,三、施测阶段 (1)预测

8、:在测验正式进行之前,让一组有代表性的被试试做题目分析(难易度、区分度等),筛选正式题目 (2)实测:把符合标准题目合成正式试卷,进行测试,报告分数统计研究施测结果(信度、效度的定量定性分析),第四节 题目编写和分析方法 一、客观题的类型 (一)多项选择题 基本原则: 1、只有一个正确答案 (1)目前还没有发现这类问题。 A.现在 B.最近 C.看来 D.在眼睛前面 (2)我们两家住斜对门,关系很好。 A.隔壁 B.邻居 C.门有些斜 D.门靠门,2、只测一个语言要素他们都认为,这是个好主意。A.意思 B.办法 C.态度 D.建设A.东西 B.办法 C.消息 D.现象 3、每一个选项在语法上都

9、应该是可替换的不要再买点心了,再买妈妈又该说我们了。A.解释 B.劝告 C.责备 D.表扬 4、文本不能太难 5、越简洁、越清楚越好 6、在试卷中一般按从易到难的顺序排列,二、题目分析的方法 1、难易度:指某个题目的答对率,即答对某题目的被试占全部参加测试的被试的比例。p=答对此题人数/总人数,范围应在0.2-0.8之间。平均难易度(一个测试的各个题目的难易度相加,再除以题目的数量),宜在0.5左右。特别要求:被试的同质性 2、区分度:指一个题目对于鉴别被试的水平所起的作用有多大。,(1)区分度指数(极端分组法):27% D=(高分组答对此题人数-低分组答对此题人数)/高分组或低分组人数。 例

10、题:P326-327。 D在-1+1之间,一般要求在0.3左右。 特点:简便;不够精确 (2)点双列相关系数:0.2以上 特点:精确;比较麻烦 3、选项分布情况 4、主观评判:是否有冒犯、是否为教学大纲规定重点,三、题目的修改,第五节 质量评估:信度和效度,一、信度:指测量结果的可靠性、一致性和稳定性程度。一个高质量的测验对同样一组被试反复测量结果应该保持一致。 1、测验信度的估计再测信度:稳定性系数,防止练习效应等值复本信度:测验的等值性,平行试卷分半信度:反映测验内部一致性程度内部一致性信度:精确评分者之间信度:0.90以上,2、影响因素:题目数量;题目的同质性;题目难易度分布;被试样本的

11、异质程度二、效度:指测量的有效性和准确性,即测量对它所要测的东西准确测量的程度。:针对特定的测量目的而言;程度概念 1、类别: (1)内容效度:实际测量内容对所欲测量内容的代表性程度。,表面效度:指一个测验从表面上看是否测了它所要测的知识或能力。:考查书面表达能力可以用写作文的方式和改错句的方式,前者表面效度高,并不一定。:成绩测验最应讲求内容效度,即最强调题目代表性,需要确定测验的范围和各部分的比例。评判方法:靠经验判断等定性分析的方法进行。,(2)效标关联效度:指测验结果与效标的一致性程度。效标是指衡量测验有效性的外部标准,通常指测验所要预测的行为。 预测效度:测验分数与一段时间后被试的行为表现之间的相关程度。 共时效度:以测验实施相同或相近时间内搜集到的其他经验性资料为标准。,(3)构想效度:理论、观念效度,测验结果与设计者关于能力的理论构想之间的相关程度。第二语言习得理论有许多假说,用测验验证,涉及构想效度 2、影响效度的因素:题目的质量(难度等);参照标准的质量;测试实施的程序是否标准化。 三、信度、效度关系信度是效度的必要前提;信度高的测验不一定效度高。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报