1、基于数据挖掘技术的大学英语过程性评价体系研究 郝小静 内蒙古科技大学外国语学院 摘 要: 现代教育再也不止步于应试教育, 而是提倡素质教育。传统保守的终结性评价显然已经不能适应社会的发展步伐, 因而一种全新的评价方式随之应运而生, 这就是过程性评价。过程性评价不仅可以让学生的学习能力有质的飞跃。还可以让教师的教学有突破性的优化。但是在过程性评价的使用过程中, 仍旧存在着这样那样的缺陷, 比如因为教师对学生相关的信息资料收集不足, 导致了逻辑错误, 从而产生了个人偏见。这就极容易造成过程性评价的真实性与有效性降低。本文就目前大学英语的过程性评价的形势提出一种新的设想, 把过程性评价使用过程中产生
2、的数据通过数据挖掘进行缜密的分析。如通过教师在英语四六级中教学中的过程性评价得到的信息利用数据挖掘来进行比较与分析, 再和教师在学生的英语四六级成绩中得出的总结性的评价实行全面比较, 推断出教师在英语教学中过程性评价能否客观合理, 进而解决过程性评价使用过程中产生的问题, 促使大学英语教育能更科学的实行过程性评价。关键词: 数据挖掘技术; 大学英语; 过程性评价; 研究; 作者简介:郝小静 (1984-) , 男, 汉族, 河北邢台市人, 硕士, 讲师, 研究方向为数据挖掘。基金:2015-2017 年内蒙古科技大学创新基金项目“数据挖掘技术在大学英语成绩分析中的应用研究” (项目编号:201
3、5QDL26) ;2015-2017 年内蒙古科技大学教改项目“我校大学英语生态环境构建的实证研究” (项目编号:JY2015012) 1 过程性评价的含义及作用过程性评价的最早提出在 1967 年的美国, 是哲学家斯克里文在论及课堂的改革与发展时提出的。1971 年斯塔佛尔比姆 (Sufflebeam, D.L) 等人在提出 CIPP (context, input, process, product) 评价模式时也曾提及过程性评价。过程性评价的提出, 要求教育工作者对于求学者的学习评价不应只止步于成绩带来的总结性评价, 而是应当把评价看成一个连续不间断的、全面客观的科学体系。过程性评价有电
4、子档案袋、评价量表、纸笔测验评价等方式。而电子档案袋作为一种新兴实用的评价方法, 已在国外教育领域得到了十分广泛的应用。20 世纪 80 年代末, 美国开始把过程性评价引进中小学课堂教学中, 以此对学生的学习过程进行评价。随着互联网信息技术及电子科学技术的迅速发展, 美国的中小学、大学、成人大学以及在职教育机构等领域均使用电子档案袋对其学习过程进行评价。综上可见, 评价学生的好坏再也不以一张试卷作为定论, 过程性评价的显著成效已经奠定了它在教育领域的重要地位, 起着不可取代的重要作用。英国评价研究小组 ARG 发现, 对于学习成绩不理想的学生来说, 无限循环重复的考试无法提高他们的对学习的热情
5、, 反而打击着他们的上进心和自尊心。一纸成绩并不能真实反映出学生的具体情况, 比如有一些学生, 明明平时刻苦认真的学习, 却因为一时的大意, 考试成绩不理想, 就被定性为差生, 这就意味着否定了他们在学习过程中付出的所有努力, 使他们意志消沉荒废学业, 从而进化成真正的差生, 大大拉开了与优等生的之间的差距。因此以考试作为评价学生的最终结果的腐朽方式显然已不能符合当今教育领域的发展潮流, 过程性评价的使用才是明智之选。英国学者 Black 和 William 认为:过程性评价对学生的学习表具有显著的促进作用, 对学习表现不佳的学生而言, 影响更为深远。纵观国内, 自新课改实行以来, 过程性评价
6、就被全国各地的高等院校应用到各个科目的课堂教育中。特别是大学英语的课堂教学, 投入过程性评价的使用, 明显能提高学生对外语的学习兴趣与热情。总的来说通过过程性评价让教师更准确、真实、全面的了解学生的学习具体的概况, 让教师及时做出有针对性教学方案, 提高学生的学习能力。2 数据挖掘技术的定义及其在过程性评价中的作用顾名思义这一技术的定义就是数据的挖掘, 是过程性评价中的关键决策手段之一。数据挖掘技术能从大量错综复杂的数据分析概括, 对数据进行抽取、转换, 探究出隐藏其中的逻辑规律与关系, 从而为我们对群体总体概况的调研行动提供了有用的帮助, 促使最后的决策得到最合理与最客观的选择。数据挖掘是深
7、层次的数据信息分析方法, 将其应用到大学英语过程性评价体系中无疑是锦上添花。它可以全面、深入的分析过程性评价得出的结果及其隐藏在各种因素中内在联系, 从而完善过程性评价体系, 促使整个过程性评价的应用过程更为科学客观。3 大学英语过程性评价的概况与现存问题英语作为世界性的国际通用语言, 是和各国群众进行政要、军事、财政、文化交流的主要交际用语, 因此英语已经被众多国家普及应用与学习。在这些英语学习者中, 学生的占比最重。大学英语的过程性评价是指教师从学生在课堂教学过程中的具体表现, 如学生对知识获取的多少、内容的掌握的深浅等, 掌控好自己的教学手段, 对学生进行更贴心、更实效的评价。改革开放以
8、来, 应试教育成为我国教育的主要教育模式, 因而成绩的好坏最终成为评论一个学生优劣的主要评价标准, 成绩的高低成为一个学生是否努力的凭证。不可否认, 成绩的总结性评价确实可以某种程度上体现出学生的学习状况, 同时也存在严重的弊端。比如一个老师接手一个班的新生, 很容易从现有的资料对学生进行先入为主的评价, 这种现有的资料无非就是学生之前留下的考试成绩, 这样主观性的评价, 缺乏合理与客观, 对学生也极其不公平。所以, 这种传统的评价方式已经不适合如今日渐更具开放性的大学教育, 过于刻板必然没有创新, 我们急需一种全新的科学评价体系, 它就是过程性评价。大学过程性评价通过融入数据挖掘技术, 对数
9、据进行抽取筛选与转换, 让我们对学生的综合素质的了解更加量化, 对学生的学习成果的掌握更加真实。这样才能彰显大学英语过程性评价体系的优越性, 使其在教育领域中起到导航的作用, 如实反映学生的具体状况。虽然国内部分地区已经着手研究过程性评价在大学英语中的运用, 但是这些研究大多都是片面的, 没有准确落实到关键之处。4 设定实验计划4.1 实验目标。本文作者针对现今一般大学英语过程性评价与融入数据挖掘后的大学英语过程性评价实行比较, 来分析研究数据挖掘在大学英语过程性评价中的关键作用, 客观的展现数据挖掘技术关于学生学习情况评价的科学性。4.2 数据挖掘的步骤及原理。作者根据数据挖掘的根本原理,
10、对照数据挖掘的一般步骤, 如图 1 所示, 收集大量的数据, 应用数据挖掘对数据进行剖析概括、抽取筛选、转换, 把大批量的数据进行分解处理, 然后把分解的数据重新拼接出一个全新的数据, 进而挖掘出数据中隐藏的各种内在联系。图 1 下载原图4.3 实验研究对象的选择与实验策划。本实验的研究对象设定为内蒙古科技大学 2014 级新生, 同时以新生在一、二年级两个学年内对于大学英语的学习过程记录作为数据库。从这些新生中随即选出 500 名, 分成 9 个英语教学班, 对这 9 个班的学生进行分类改革, 改革实施“三无”教学模式, 即无固定地点、无固定教材、无期末统考。改革以后, 上课不再刻板呆滞,
11、教学内容与形式的多样化, 让学生的学习情绪瞬间高涨起来。没有这些框框条条的束缚, 我们可以在课堂上实行英语角色演讲、情景对话、英语才艺表演、英语户外活动等, 还可加入英文歌曲、电影赏析、诗歌鉴赏等多媒体的辅助, 从而让学生的听力、翻译能力、以及口语能力都得到大幅度的提升。这样的课堂累积下来的数据记录必然是一个丰富的数据库, 从这个庞大的数据库里再随机抽取 3 个班的数据记录作为分析对象, 最后经过转化与处理就得出我们需要评价结果, 给出学生最为真实合理的学习成绩。4.4 实验中数据挖掘的过程。经过对大学英语课程内容的学习和考核结果分析, 以及从任课教师那里所获取的相关成绩、上课发言主动性、课堂
12、演讲内容的充分性和完整性、学生听力训练和翻译训练中所体现出的英语熟悉程度, 学生英语四级考试的成绩等大量信息, 更深一层分析学习大学英语与大学英语四级考试之间的内在联系及其对于学生整体素质评价的联系, 进而提出使用数据挖掘来应用到大学英语过程性评价中, 以此提供科学客观的依据。4.5 数据挖掘的合理运用。数据挖掘运用到大学英语过程性评价中需要解决面临的三个重要问题, 这样才可以确保实验研究的真实性和实效性。第一, 大学英语课程的学习要求与英语四级考试的要求是否相符?学生在学习大学英语中的总体评价是否可以体现出学生的英语四级考试成绩;第二, 二者的学习目的是否一致, 存在什么样的联系?第三, 教
13、师在英语过程性评价中掺进了多少自己的主观意识?会不会影响教师评价学员的综合成绩?首先我们可以知道, 大学英语是根据大学英语教学大纲进行编写的, 同时英语四级考试也是根据大学英语教学大纲由教育不高等教育司组织的全国统一的单科性标准化教学考试, 所以它们二者对学生提出的要求是一样的。其次, 大学英语课程侧重对学生听、说、写、翻译及应用的能力, 全面而均衡的发展学生的英语水平, 对于英语四级考试绝对是百利而无一害的, 因此, 学生在大学英语课程学习过程中的综合评价是可以体现学生的英语四级考试能力的, 起码可以预测该学生是否具备英语四级考试的过关能力。再有就是二者的目的是否一致的问题, 英语四级考试的
14、目的是推动大学英语教学大纲的贯彻执行, 对大学生的英语能力进行客观准确的测量, 而大学英语课程的目的也是为了全面提高学生运用英语能力, 所以二者的目的也是一致。最后, 在大学英语的教学过程中, 教师的过程性评价是否客观合理, 有没有被主观意识所牵制, 从而影响了教师对学生的评价, 这个也值得我们注意的。就此本文通过实验测试来分析下如何避免这样的负面问题。5 实验研究的过程5.1 数据的选择。通过实验研究的对象确定以后做出的实验, 为我们提供大量的数据信息。从这样庞大的数据库里挖掘我们需要的数据, 筛选出那些对我们毫无用处的信息, 防止没用的信息混肴教师对学生综合素质的评价。数据的选择必须在随机
15、状态下实行, 从 3 个班级中选择同样分量的考试成绩, 可以使被抽取出来的数据信息代表所有新生学习大学英语的情况。另外, 在进行数据的选择时, 必须确保所收集的信息的完整性, 将人为输入造成的实验误差减到最低。5.2 处理选取的数据。数据经过抽取选择以后, 我们可以对其进行分类汇总, 把各种不同的数据转换成相对应的数据格式。因为我们实验所挖掘的数据都是随机抽取的, 并且绝大部分都是手工输入的, 所以这样的数据库会非常的纷乱复杂, 存在很多可见与不可见的问题, 如数据的缺失、冗余、异常等问题。因此我们需要对这些数据进行分门别类的处理, 使其拥有对应的格式。5.3 数据的拼凑与组装。分门别类的数据
16、信息经过处理后找到了对应的格式, 就该进行拼接组装了。此时我们就需要使用数据挖掘这个独特的技术对以上经过初步处理的数据信息进行汇总分析, 把相同类型的数据信息组装在一起, 就得出一个宏观数据模型, 接下来还需要处理剩下的那些并非相同类型的繁琐数据信息, 使用数据挖掘技术把它们拼凑起来, 又变成了一个完全不一样的新数据, 还可以挖掘出隐藏其中的各种内在联系。5.4 数据的挖掘与提取。通过以上对数据的选择、处理、拼凑组装等一系列操作, 接下来就可以进行数据的挖掘与提取工作了。如何选择挖掘算法是数据挖掘技术中的核心所在, 为本次实验研究选出最合适的算法。目前存在于数据挖掘技术中的关联规则算法有三种,
17、 分别是 Apriori 算法、划分算法和 EP-树频算法。在本文的实验中, 我们将利用到“购物篮分析”划分算法来帮我们研究学生的学习行为。所谓的购物篮分析就是通过这些购物篮子所显示的信息来研究顾客的行为。套用到我们的实验中, “顾客”就是我们的“学生”。这种算法的主要目的在于找出什么样的数据信息应该放在一起分析。藉由学生的的学习行为来了解学生在学习大学英语中呈现给我们什么样的数据信息。通过这样详细的分析, 我们就可以进行准确的数据挖掘与提取, 使大学英语过程性评价体系更加完善更加科学。同时划分算法较之 Apriori 算法在效率上有更大的提升。因此, 选择贴切的算法不但能节省大量的时间而且能
18、更有效的提高数据挖掘的效率。6 实验研究的结论综上所述可得出结论, 通过使用数据挖掘, 发现大学英语课程的过程性评价与英语四级考试成绩有着密不可分的关系。从中我们也证明了, 投入使用数据挖掘技术, 可以有效的控制减少教师在大学英语过程性评价中掺入过多的主观性评价, 使过程性评价更具客观性与真实性。7 结语随着现代信息技术不断的发展成熟, 数据挖掘技术的崛起与推广应用, 教育行业也可占一分先机。通过运用科学的数据挖掘技术融入到大学英语教学中, 有效的改进传统的总结性评价, 甚至在必要的时候可以取代它。过程性评价采用的是一种自由开放的评价方式, 没有特定的模式, 给予教师与学生最大的发挥空间, 使其在大学英语的学习过程中各取所需。因此大学英语过程性评价中收集的信息通过数据挖掘技术的精密处理后, 使过程性评价更科学、更客观、更全面。尽管数据挖掘技术在教育领域的应用仍然不够成熟及深入, 对于许多高校来说, 他们仅仅是停留在对数据信息的存储与查询的基本阶段, 并未能够很好的利用数据挖掘技术, 但是它在教育研究领域中的前景是非常远大, 其贡献价值将必然无可限量。参考文献1吴羊.数据挖掘在大学英语教学质量分析中的应用研究J.现代教育技术.2010, (04) :73-76. 2郭瑞波.数据挖掘技术在英语成绩评价中的应用J.金融理论与教学.2012, (05) :82-84.