1、第一章 语言测试概述l 语言测试学:是一门综合性很强的学科,属于应用语言学的一个重要分支。其基础除了语言学和语言教学,也包括认知科学、心理测量学、教育统计学,以及信息科学等。研究任务是建立和发展 测试理论 ,研发并完善各类 语言测试。l 语言测试第一节 语言测试的基本原理l 一 、什么是语言测试l 1、一般认识:针对语言知识和技能进行的考试。是教育评估的手段,也是教学活动的重要环节。l 2、本质属性:测量工具。旨在科学的测量出学习者的语言能力。l 3、测试目的:l ( 1)选拔。l ( 2)诊断。l ( 3)评估: 对学生进行评估; 对教材、教学法、教师的教学进行评估。 l ( 4)督促。l
2、( 5)研究: 研究语言本身; 研究语言教学; 研究语言习得过程; 研 究语言教材、教学法。( 6)推广母语。l 4、语言测试的定义:语言测试是根据一定的评估目的,以抽样方式通过有限试题来诱导出受试者的言语行为,然后借助于定量描述来推断受试者所掌握的语言知识和能力。l 5、测试的任务:设法有效地诱导出体现受试者语言知识和能力的言语行为,并对这种行为进行量化和说明解释。l 6、影响测试科学性的因素:l ( 1)间接性。语言知识和能力无法直接测量,只能通过诱导出的言语行为来测量。测试提供一种 条件或刺激 ,使掌握了某种语言规则或语言结构的受试者能立即使用出来,而没掌握的则使用不出来。制造这样的条件
3、 命题, 是进行测试的最大难点。 语言的某些方面,特别是语法结构 最难诱导,而且诱导出来的言语行为也不一定能真实地反应其语言知识和能力,尤其是这种言语行为不是在真实的较集中自然产生的,这就决定了语言测试总是一种非自然的、间接的测量手段。l ( 2)片面性。语言测试的目的是要全面了解受试者的语言知识和能力,但实际上不可能全部考查,只能采取抽样的方式通过编制有限的试题来加以测量。科学的抽样是可以反映总体面貌的,人们可以从题型、题量、覆盖面等方面尽量做到科学化。但在实际操作中,由于一些因素的制约,难免会出现以偏概全的情况。l ( 3)主观性。作为测量和评估的手段,语言测试应该是完全客观、公平的,但实
4、际上要做到完全客观是很难的。测试的全过程都是由有关人员操作的,特别是评分很容易受到评卷人的不同认识和主观好恶的影响。l ( 4)偶然性。测试的命题、受试者的临场发挥以及评卷等过程中总有一些偶然性的因素。特别是学校的一般性考试,常出现命题不合理、受试者猜中试题,或受试者自身原因,临场未能正常发挥,使具有相同语言能力的人言语表现出了差异。l 二、 语言测试的环节l 1、规划设计阶段l 2、操作实施阶段l 3、阅卷评分l 4、后效研究l 三、评估标准l 1、信度。l 2、效度。l 3、区分度。l 4、可行性。5、后效 作用第二节 语言测试的发展过程l 一、语言测试经历的四个发展阶段l 1、传统时期(
5、前科学时期)( 18、 19世纪 20 世纪50年代初)l 测试形式确立的标志: 18世纪剑桥大学的荣誉学位考试。l 测试特点: (1)内容:很强的文学性 ;(2)测试方式:论文写作式的短文写作,翻译,口试等。l 没有科学的语言理论的指导,也没有统一的客观评估标准,测试结果完全凭考官的主观判断来决定。l 缺乏科学性、系统性,是语言测试发展的雏形时期。l 2、心理测量 结构主义时期 (科学时期)( 1950s-1970s)l ( 1) 理论体系:以结构主义语言学为理论基础;l 心理学的行为主义理论以及心理测量学的原则和方法对语言测试起到了重要的指导作用。l 逐渐发展成为一个相对独立的学科。l (
6、 2)代表人物及著作:l 美国测试专家罗伯特 拉多( Robert Lado): 现代语言测试的创始人。 l 语言测试 外语测验的开发与使用 ( 1961年)l 第一部全面论述语言测试的原理、原则和方法的专著。l ( 3)主要测试方法:l 分立式测试。重在考查外语学习者的各种语言知识,并对语言的各个要素(主要是语音、语法的各个要素)进行精确地测量。l 重视信度。l ( 4)主要题型:l 最常见的是多项选择题。该题型答案唯一、客观性百分之百,信度较高,阅卷方便,便于分析考试结果。l l 3、心理语言学 社会语言学时期(后现代时期)( 70年代初 -80年代初)l ( 1)理论基础:社会语言学和转
7、换生成语法理论。l ( 2)把语用能力纳入测试范畴。更多地关注如何从功能性、社会性和语言应用的角度进行考查。l 整体综合理论认为:语言不仅是一个可以分解的整体,更是一种动态的、具有创造性的功能体系。在语言的实际应用过程中,人们对语言符号的结构的选用,其实具有很大的冗余性,同一种思想或意义往往可以用多种形式来表达,对于某一项语言知识的匮乏基本不会影响语言交际的照常进行。测试应当对受试者的语言能力进行测试,而不要局限于对孤立的语言点的测试。重视效度。l ( 3)代表人物:l 约翰 奥勒( John Oller)“一元能力 ”假说。认为语言是一个单一的能力。 l ( 4)主要测试方法:l 综合式。l
8、 ( 5)主要题型:l 完形填空;综合改错;听写;口试;作文等。l 这些题型在重视语言形式正确性的同时,也种种对受试者的分析、综合、信息转换等语言应用能力的考查。l l 4、交际法语言测试时期( 80年代初至今)(1)基础: 70年代末 -80年代,美国语言教学界开展 “水平运动 ”。认为语言教学以及语言测试要以语言水平为中心,而语言水平则表现为 交际能力 。该运动的一个直接成果: 1982年美国外语教学委员会制定的一个水平大纲。l 同时期,欧洲相继出现建立在语言交际理论基础上的 功能意念大纲 和 交际大纲 。l 这些文件对语言测试的开发有很强的指导作用。l ( 2)发展:l 80年代中期以来
9、,随着 交际教学法 的发展, 交际式语言测试 受到了愈来愈多的重视。l 交际教学法 :以 语言功能 为纲,着重培养交际能力 。认为语言是交际工具,涉及交际目的、环境、彼此的角色等等。l 交际法语言测试认为:语言测试应按一定的 社会场景 和 交际语境 设计出测试题目,并观察学生在真实的语境中 运用语言达到交际目的的能力。(直接测试) l (3) 主要测试形式:l 角色扮演、模拟活动等。l 要求学生综合运用听说读写等各种语言技能。l 优点: 在这种测试中,学生看到他们课堂所学或所考核的内容与他们将来使用外语进行交际这一目的相关联,会产生积极效果。l 局限:很难设计出真实语境来进行测试。l ( 4)
10、代表人物:l 巴奇曼( Bachman)。 提出交际语言能力模型,成为语言测试发展史上一个新的转折点。l 巴奇曼认为交际语言能力包括:l 语言能力:由一系列语言知识构成。能够运用正确的语言形式表达。l A: 组织能力。语言符号的运用能力:理解和输出正确的句子,句子扩展成语篇等。l B: 语用能力。根据社会约定俗成的交际原则,随时调整语言行为,使之适合交际语境的要求。l 策略能力:在具体的语言交际中,借助智力因素和常识性认识,运用各种语言知识实现交际目的的心理活动。l A: 评估。对语言信息和语境信息作出评估。l B: 计划。快速检索词汇、语法、语篇等知识进行构思。l C: 执行。选择合适的渠道
11、(视觉、听觉)进行交际。l 生理心理机制 :在理解或输出语言过程中所涉及的各种神经和心理过程,如大脑语言中枢的任务分区,语言信息表征的储存方式,记忆的特征,视觉及听觉神经系统处理信息的过程,注意的模式等。l 交际语言能力l l 语言能力。 策略能力 。 生理心理机制。l l A 组织能力 A 对语言信息l B 语用能力 和语境信息l 作出评估;l B 运用现有词汇、l 语法、语篇要l 素构思;l C 进行恰当的交际。l 巴奇曼的语言交际能力模型几乎成了整个 90年代语言测试领域讨论的中心,但时至今日也没有一个真正公认的可靠有效的测试。 l 二、中国语言测试的发展l 1、基础:l 西周时期就开始
12、用考试选拔人才,后来科举制完善成熟。虽有弊病,却是一个标准化程度很高的测试体系。西方传教士带入欧洲,借鉴并创新,在理论、原则和方法上都形成了更为科学的体系。l 2、现代语言测试。l ( 1)外语测试。直到 70年代末、 80年代初美国托福考试等国外标准化语言测试传入中国,才开始重视第二语言测试的研究,并开发出 “英语水平考试( EPT) ”、 “大学英语考试(CET)”等标准化的语言水平考试。 l ( 2)汉语作为第二语言的标准化考试。l 1984年,北京语言大学开始研制专门用来测试母语非汉语者的汉语水平的标准化测试 汉语水平考试( HSK)。 1986年研发出第一套汉语水平考试试卷(初中等)
13、,并在北语试测。 1990年正式推出。l 后来陆续开发出高等 HSK、 基础 HSK试卷。l 实用汉语水平考试( C-TEST)。 北语研发。l 测试母语非汉语的外籍人士在国际环境下的社会生活以及日常工作中运用汉语的能力。目的是考查考生在商务、贸易、文化、教育等环境中的语言能力。l 商务汉语考试( BCT)。 汉办、北大研发。原名 HSK( 商务)。为测试母语非汉语者从事商务活动所应具有的汉语水平而设立的国家级标准化考试。l 少数民族汉语水平考试( MHK)。l 新版 HSK。 汉办开发。l HSK( 少儿) HSK( 文秘) HSK( 旅游)。l ( 3) 现状:考试制度还不够健全考试方法还
14、没有完全走上科学化轨道。 没有学能测试; 成绩测试的专门研究较少,凭经验的现象较多。 第二节 语言测试的分类l 一、根据测试的目的、用途或功能,主要分为成绩测试 、 水平测试 、 学能测试 、 分班测试 、诊断测试 五类。l 1、成绩测试l 也叫课程测试或学业成就测试。在教育测试中运用最广。是一门课程或一种课型的测试。目的在于检查学习者在某一教学阶段是否掌握了教学大纲和教材所规定的教学内容,在学业上取得了什么成就。l 单元测验、(周考、月考、)期中考试、期末考试。结业考试。l 成绩测试属于回顾性测试。l 特点:教什么就测什么,学什么就测什么,甚至是怎么教就怎么测。l 成绩测试必须以教学单位所规
15、定的学习者需要掌握的教材内容或教学大纲内容为依据,测试内容不应该超过教材或大纲的范围。l 评价成绩测试质量最重要的方面,就是该测试是否有效地体现了教学大纲或具体课程所规定的教学目标、教学内容。l 通常由各教学单位的任课教师或教学主管自己编制。l 重视 内容效度 。l 2、水平测试l 也叫能力测试或熟巧程度测试。在教学过程以外进行。目的在于考查受试者现有的综合运用语言的能力,以评定是否达到胜任某项任务的要求。l 通常是大规模的标准化测试。l 与成绩测试 区别区别 :测试内容不以特定的教学大纲、教学课程为依据,不考虑考生的学历、母语背景、学习环境等,只关心考生能否使用目的语完成特定的任务。l 水平
16、测试内容的确定:l 通常,设计者先对学习者需要运用目的语来完成的特定任务进行需求分析,在此基础上确定命题原则、制定命题大纲和命题细则,然后在编制测试题目。l 最重视的是结构效度,同时也重视预测效度。 l 学能测试 :l 也叫潜能测试、能力倾向测试、禀赋测试等等。在教学前进行。属于前瞻性测试。l 测试目的:在受试者开始学习一门语言之前,先了解他是否具有学习语言的能力,也就是能否学好目的语。l 学能测试的一个基本假设是:人与人在学习语言方面的天分或潜能是 不同 的。 l 测试内容:不是受试者已有的语言知识和语言能力,而是潜在的学习能力。通常采用受试者不熟悉的语言。l 【美】卡罗尔( Carrol)
17、 认为语言学能主要考查四种能力:l ( 1)语音编码解码能力。l ( 2)语法敏感性。l ( 3)强记能力。l ( 4)综合归纳能力。l 还有人提出:语言表达能力、性格等。l 已有的学能测试:l 卡罗尔和萨彭: 1959. 现代语言学能测试l 卡罗尔和萨彭: 1967. 初级现代语言学能测试l 平斯勒: 1966. 语言学能考试l 开发语言学能测试的意义( 1)为语言教学解决问题;( 2)推动关于语言能力的研究。l 4、诊断测试l 教学中进行。属于回顾性测试。测试内容:学生学过的内容。教什么就测什么。l 与成绩测试区别:l 测试目的不同。诊断测试不是为了评估学生的成绩,而是为了了解学生对所学内容的掌握情况,及时发现教学过程中可能出现的各种问题,为教师调整、改进教学提供必要的反馈信息。l 特点:规模小;测试内容集中;题目相对较少;命题、评分都比较灵活。对信度、效度都没有太高的要求。l 5、分班测试l 也叫安置测试。在教学前进行。l 测试对象:已经学过目的语的人。l 测试目的:l 了解受试者现有的语言水平,以便确定适合他们的课程和班级。l 测试内容大都以本教学单位的教学大纲为依据。l 学生以前学过的课程、 HSK成绩可以作为分班的参考依据。l 五种主要类型之间并非完全割裂。