1、电子书包中基于大数据的学生个性化分析模型构建与实现路径 武法提 牟智佳 北京师范大学教育学部教育技术学院 摘 要: 该文在对大数据特征分析的基础上, 对电子书包各学习系统生成大数据的缘由进行了分析, 并以学生电子书包中电子学档系统所记录的结构化、半结构化以及非结构化的大数据信息为分析对象, 以学生个性化学习、个性心理学和学习分析为理论依据, 构建了基于电子书包大数据的学生个性化分析模型。该模型以学习内容个性化、学习活动个性化、学习方式个性化和学习评价个性化为分析维度, 以相关的系统数据库支持为出发点, 对系统中的学生个性化信息进行分类汇聚。在此基础上, 通过对各系统要素间的语义关系进行分析,
2、建立了学生个性化分析模型要素的关系框架, 并从个性化学习资源推送、个性化学习过程监控与指导以及个性化学习社区推荐等三个方向分析了学生个性化分析模型的实现路径, 以期为今后开展基于大数据的学生个性化学习分析研究提供理论指导。关键词: 电子书包; 大数据; 学习分析; 个性化分析模型; 实现路径; 作者简介:武法提:教授, 博士, 博士生导师, 研究方向为数字化学习环境与学习资源设计 () 。作者简介:牟智佳:在读博士, 研究方向为数字化学习技术与环境 () 。收稿日期:2013 年 11 月 1 日The Model Construction and Implementation Path of
3、 Students Personality Analyzing Based on Big DataWu Fati Mou Zhijia School of Educational Technology, Beijing Normal University; Abstract: This paper analyzes the reason for the big data generated by the system of electronic schoolbag on the basis of analyzing the feature of big data. And it regards
4、 the information of big data which includes structured data, semi-structured data and unstructured data as analyzing object and the theories which include personalized learning, personality psychology and learning analytics are considered as theoretical basis. Then an analyzing model of students per
5、sonality is constructed based on the big data generated by electronic schoolbag. The model consists of four analysis dimensions which are personalized learning content, personalized learning activities, personalized learning styles and personalized learning evaluation. The personalized information i
6、s classified and gathered based on the support of relative system database. Furthermore, relational framework of the element for personalized model is established by analyzing the semantic relationships among the various elements of the systems. Implementation paths are showed from three directions
7、which include pushing personalized learning resources, personalized learning process monitoring and guidance and pushing personalized learning community so that it can provide theoretical guidance for the analysis of personalized learning based on big data in the future.Keyword: Electronic Schoolbag
8、; Big Data; Learning Analytics; Personalized Analysis Model; Implementation Path; Received: 2013 年 11 月 1 日一、学生个性化发展的诉求与契机(一) 促进学生个性发展是教育信息化的价值取向当前我国的教育信息化发展进入到以有效支持教与学、促进学生个性化发展为核心诉求的新阶段。教育信息化十年发展规划 (2011-2020 年) 在基础教育信息化发展水平框架中提出, 学校教育教学方式的变革要在学生多样性、个性化学习方面的改变上取得突破1。“十二五”教育信息化的核心目标与标志工程是要建设“三通两平台”
9、, 其中“网络学习空间人人通”作为其中一个重要组成部分为学生的个性化学习提供了平台支持与政策保障。因此, 从国家教育信息化政策中可以看出, 为学生提供个性化学习环境, 促进学生个性发展是教育信息化发展的内在旨趣。从媒体技术发展的实践轨迹来看, 社会网络、平板电脑、电子书包等技术与教育的逐步融合, 是媒体技术在以支持学生个性化学习为目标导向下自为性的结果。可以看出, 从教育政策到技术应用, 促进学生个性化发展是教育信息化发展的核心诉求和价值取向。(二) 电子书包为支持学生个性化学习提供了可能电子书包作为更新传统教材形式的先进工具, 近年来受到国内外教育行业的持续关注。当前, 关于电子书包的概念尚
10、未有一个统一的认识。祝智庭教授认为, 从硬件设备角度上讲, 电子书包是一种个人便携式移动终端, 从电子书包教育教学的系统功能架构视角看, 电子书包是学生的个人学习环境2。钱东明等认为电子书包是一种具有阅读电子课本、管理学习资源、记录个人学档功能, 具备支持各种有效学习方式的个人学具和交互式学具, 具有信息处理能力和无线通信功能的个人便携式信息终端3。王斌等认为电子书包是一种以网络、移动设备为基础, 以促进学生有意义学习的软件为架构, 以动态开放教学资源为灵魂, 支持移动学习甚至终身学习的数字化学习空间?4?。尽管对电子书包内涵界定的视角存在差异, 但从各个定义中可以看出, 个性化和移动性是电子
11、书包的共性特征。电子书包在支持学生的个性化学习和移动学习方面有着独特的优势, 为促进学生的个性化发展提供了现实路径。(三) 基于大数据的学习分析为学生个性化发展 带来契机大数据是近年来出现在通信和计算机领域中的一个热门关键词。关于大数据业界尚未有一个统一的定义, 但却有两个观点能够诠释大数据的本质。第一个观点来自于 Gartner 公司的 Merv?Adrian 在 2011 年第一季度刊登在Teradata?Magazine 上的一篇文章, 文中指出“大数据超出了常用硬件环境和软件工具在可接受的时间内为其用户收集、管理和处理数据的能力”?5?。另一个观点来自于麦肯锡全球数据分析研究所 (Mc
12、kinsey?Global?Institute) 在 2011 年 6 月发布的大数据:创新、竞争和生产力的下一个前沿报告, 报告中提出“大数据是指大小超出了典型数据库软件工具收集、存储、管理和分析能力的数据集”?6。Gartner 公司将大数据概括成大量化 (Volume) 、多样化 (Variety) 和快速化 (Velocity) 等 3V 特征7, 各特征的表现形式及发展演变如图 1 所示。图 1 大数据的 3V 特征及其演变 下载原图大数据与传统教育数据最本质的区别体现在采集来源以及应用方向上。传统教育数据的整理方式注重凸显学生整体的学业水平, 而大数据则更注重关注每一个学生个体的微
13、观表现, 它可以分析微观、个体的学生与课堂情况, 用于调整教育行为与实现个性化教育8。大数据给教育带来的变化主要体现在三个方面: (1) 个性化教育具有了可能性, 真正实现从群体到个体; (2) 思维路径的改变从演绎转向归纳, 在“去经验”的过程中找到真正影响教育的重要因素; (3) 信息真实性的凸显, 让信息从可疑到可信, 使研究者能够真正获悉真实的情况9?。电子书包作为学生的个人移动终端, 在学生使用过程中会记录学生的大量结构化、半结构化以及非结构化个人学习信息, 进而产生大数据。而基于大数据的学习分析能够依据学习者的学习行为分析其知识基础和认知能力, 进而为其提供个性化的学习内容和资源,
14、 促进其个性化发展。二、电子书包生成大数据的缘由及结构化分析通过前面对电子书包内涵的梳理和分析发现, 已有的界定内涵太小外延太大, 对于后面的分析缺乏有效的指导。电子书包是在我国教育信息化深入推进和信息技术高度发达的背景下产生的, 能够承续我国各层次教育信息化发展水平, 解决当前学习环境下的教与学问题, 并能满足新形势下学生的各种学习方式。而“十二五”教育信息化的核心目标与标志工程之一是要建设“网络学习空间人人通”, 来满足学生个性化学习的现实需求。基于此, 我们认为电子书包是基于教育云平台的满足学生阅读交互式电子教材、管理个人学习资源、支持学生互动交流和练习测评, 并能记录个人学档的个人学习
15、环境, 它包括电子教材系统、数字资源系统、作业与考试系统、互动交流系统和电子学档系统。其中电子学档系统主要是对学生在前面四个系统中的学习进行记录和分析。因此, 对电子书包是否产生大数据的分析主要是对前面四个系统生成的数据进行分析。下面将依据电子书包所包含的四个系统及其生成的数据从数据量、数据类型和处理速 度三个方面进行分析。(一) 电子书包生成的海量学习数据内容分析电子书包生成的海量学习数据主要来自电子教材系统、数字资源系统、作业与考试系统和互动交流系统, 如表 1 所示。表 1 电子书包生成的海量学习数据 下载原表 其中: (1) 电子教材系统主要包括交互式电子内容、知识管理和社会性阅读,
16、这里记录的是学生在电子教材中看过的知识点、对电子教材中的知识点进行标记管理以及与同学分享阅读的知识内容, 学生在电子教材系统中的学习行为主要生成海量的学习内容序列节点数据; (2) 数字资源系统主要包括课件点播和课外阅读, 这里记录的是学生看过的教学视频及其时间点、学生浏览过的教学课件以及课外读物等, 学生在数字资源系统中的学习行为主要生成海量的学习资源序列节点数据; (3) 作业与考试系统主要包括作业练习和考试测评, 这里记录的是学生做练习的试题和批阅结果以及学生参加考试的试题、各题目用时、知识点掌握情况分析等, 学生在作业与考试系统中的学习行为主要生成海量的练习测评序列节点数据; (4)
17、互动交流系统主要包括互动答疑、学习社区和家校互动, 这里记录的是学生参与答疑的次数及知识点分布、学生参与学习社区交流的次数及讨论主题分布、教师与家长互动的主题及频数等, 在互动交流系统中教师、学生和家长相互间学习交流主要生成海量的互动交流序列节点数据。基于上述分析可以看出, 学生在四个学习系统中的学习行为生成的是不同类型的海量学习数据。(二) 电子书包生成的学习数据类型分析电子书包所产生的多样化数据类型主要由视音频类资源、图片类资源、数字动画类资源和文本类资源组成, 如表 2 所示。其中: (1) 视音频类资源包括教学视音频、微视频和网络视音频, 主要来源于电子教材系统和数字资源系统, 这类资
18、源主要生成半结构化和非结构化数据; (2) 图片类资源包括教学图片和网页图片, 主要来源于电子教材系统、数字资源系统和作业与考试系统, 这类资源主要生成半结构化和非结构化数据; (3) 数字动画类资源包括 Flash 动画和网页动画, 主要来源于电子教材系统和数字资源系统, 这类资源主要生成半结构化和非结构化数据; (4) 文本类资源包括电子教材、课外阅读和教学课件, 主要来源于电子教材系统、数字资源系统、作业与考试系统和互动交流系统, 这类资源主要生成结构化数据。通过分析可以看出, 电子书包不同学习系统中的各类学习资源能够生成结构化、半结构化和非结构化等多种类型的数据。表 2 电子书包生成的
19、多样化学习数据 下载原表 (三) 电子书包实时处理的学习数据类型分析电子书包对学习数据的实时处理主要体现在学习内容实时交互、练习评测即时反馈和学习交流同步互动三个方面, 如表 3 所示。其中: (1) 学习内容实时交互发生在电子教材系统和数字资源系统中, 主要包括文本交互、图片交互和视频交互; (2) 练习评测即时反馈发生在作业与考试系统中, 主要包括实时练习、在线测评和即时反馈; (3) 学习交流同步互动发生在互动交流系统中, 主要包括实时答疑、同步讨论和异步交流。无论是学习内容交互、练习考试测评还是学习互动交流, 电子书包都能对这些数据进行实时处理并提供即时反馈。表 3 电子书包实时处理的
20、学习数据类型 下载原表 通过上述分析可以看出, 电子书包中的各个学习系统能够生成海量学习数据, 这些数据涉及结构化、半结构和非结构化等类型, 且能够对这些数据类型进行实时处理。电子书包所生成的学习数据符合大数据的大量化、多样化和快速化三个基本特征, 因此, 笔者认为应用电子书包所生成的学习数据属于大数据, 而基于大数据的学习分析能够为学生的个性化学习提供数据支持。三、基于大数据的学生个性化分析模型构建(一) 学生个性化分析模型的理论依据在对电子书包中基于大数据的学生个性化信息分析过程中, 既需要考虑学生个性化的外在学习特征和内在心理表征, 又要考虑如何从海量数据中挖掘有价值的个性化学习信息。因
21、此, 在构建学生个性化分析模型之前, 本研究以个性化学习、个性心理学和学习分析理论为基础, 确定了各自的分析框架和构成要素, 如表 4 所示。表 4 个性化分析模型的理论基础 下载原表 在个性化学习指导方面, 当前关于个性化学习的内涵有多种界定, 李广认为个性化学习是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式, 促使学生各方面获得充分、自由、和谐的发展过程10?。杨南昌认为个性化学习是根据学习者的个性特征实施的学习活动, 是根据学习者个别所需提供最佳的学习方法和策略, 它是在教师或学习者组成的小团体中开展的一种学习方式11?。王艳芳认为个性化学习强调以学习者为
22、主体, 针对学习者个性特点、知识经验和能力、学习需求、偏好以及具体学习情境而采用恰当的学习方法、学习内容和学习进度, 促使学习者的能力与个性在学习活动过程中得到充分、自由、和谐的发展12?。英国教育与通讯技术局 (BECTA) 在个性化学习:技术提供机遇一文中提出, 个性化学习是一种以学生为中心、以满足全体学生特别是那些学习有困难学生需求的包容性的学习方式13?。通过对个性化学习内涵的梳理和相关文献的分析可知, 个性化学习包括个性化的学习需要、学习内容、学习活动、学习方式、学习过程、学习进度、学习策略、学习评价等特征要素, 这些特征要素依据所指向的目标对象与内容属性, 可进一步归类为学习内容个
23、性化、学习活动个性化、学习方式个性化和学习评价个性化。其理论指导意义在于, 在构建学生个性化分析模型时要着重从个性化的学习内容、学习活动、学习方式和学习评价四个层面提取信息要义。个性心理学理论通过探讨个性心理结构发现个性的各种特征和表现以及它们之间的联系, 找出个体的内在主导品质, 最终揭示出个性的本质和规律14。在实际操作层面, 通过分析学生的学习需要、学习动机、学习风格、认知能力和操作技能等个性倾向性和个性心理特征15, 为个性化分析模型的构建提供心理学支持, 从而满足学生的个性心理需求。学习分析是以理解和优化学习及其发生的环境为目的, 对学习者及其所处情境的数据进行的测量、收集、分析和报
24、告16, 该定义包含了一些技术, 如预测建模、建立学习者档案、个性化和自适应学习、早期干预、社会网络分析、概念分析和情绪分析等17, 其实质是对数据背后隐藏的学习信息进行挖掘、分析、理解和有效应用。通过对学习分析中的应用目标、服务对象、数据来源和方法技术等内容框架进行分析18, 把握收集数据、信息加工和结构应用的循环过程, 能够为个性化学习内容定制和智慧性服务提供科学依据。(二) 学生个性化分析模型的目标导向教育部颁布的基础教育课程改革纲要 (试行) 中提出, 要“改变课程过于注重知识传授的倾向, 强调形成积极主动的学习态度;改变课程实施过于强调接受学习、死记硬背、机械训练的现状, 倡导学生主
25、动参与、乐于探究、勤于动手”?19。国家中长期教育改革和发展规划纲要 (2010-2020 年) 在第十一章“人才培养体制改革”中的创新人才培养方式部分提出, 注重因材施教, 关注学生不同特点和个性差异, 发展每一个学生的优势潜能20。从国家的教育政策中可以看出, 学校教育要从“课堂、教师、教材”“老三中心”向“学生、学习、学习过程”“新三中心”转变, 真正关注学生的学习。本研究中构建的学生个性化分析模型在以学生为中心的基础上, 以学生的个性化特征为逻辑起点, 以满足学生的个性化需求为实现过程, 以学生的个性化学习为目标导向, 最终实现学生的个性发展。(三) 学生个性化分析模型的构建通过前面对
26、个性化学习特征的分析和学生个性化分析模型的目标导向分析, 在电子书包四个子系统及其生成大数据的基础上, 我们提出了基于大数据的学生个性化分析模型, 如下页图 2 所示。该模型以学习内容个性化、学习评价个性化、学习活动个性化和学习方式个性化为分析维度, 以相关的系统数据库支持为出发点, 对系统中的学生个性化信息进行分类汇聚, 具体内容包含四个方面。1.个性化学习内容的系统支持与分析类目个性化学习内容的数据来源主要由电子书包中的电子教材系统数据库和数字资源系统数据库提供支持。基于电子教材系统数据库的分析类目主要包括交互式电子内容、知识管理和社会性阅读, 其中交互式电子内容中包含的学生个性化学习信息
27、有学生学习过的文本内容、学生看过的视频片段、学生学习过的数字动画等, 知识管理中包含学生标记的知识点和添加的学习笔记, 社会性阅读包括学生分享的知识理解和关注的知识点。基于数字资源系统数据库的分析类目主要包括课件点播、课外阅读和网络资源, 其中课件点播包含的学生个性化信息有学生看过的教学课件、教学视频和数字课程等, 课外阅读包括学生浏览过的网页内容和课外文档, 网络资源包括学生浏览过的文本主题和视音频资源。2.个性化学习评价的系统支持与分析类目个性化学习评价主要从形成性评价和总结性评价两个层面展开。形成性评价所需的系统支持包括电子教材系统数据库、数字资源系统数据库和互动交流系统数据库。其中基于
28、电子教材系统数据库的 学生个性化评价信息分析类目包括学生知识点学习情况、学习笔记完成情况、知识理解分享情况等, 基于数字资源系统数据库的评价信息包括视频中交互活动的完成情况、教学课件学习情况和课外阅读完成情况, 基于互动交流系统数据库的评价信息包括发布和回答问题数量情况以及参与社区讨论情况。总结性评价所需的系统支持主要是作业与考试系统数据库, 其评价信息分析类目包括个人完成作业情况、小组完成作业情况和考试测评结果分析。3.个性化学习活动的系统支持与分析类目个性化学习活动主要从活动目标、活动内容、活动方式和活动评价四个层面展开。其中活动目标由电子教材系统数据库提供支持, 其分析类目包括活动中涉及
29、的知识点分析、活动知识笔记分析和活动中知识分享情况分析;活动内容由数字资源系统数据库提供支持, 其分析类目包括与活动内容相关的文本资源分析、视频资源分析和图片资源分析;活动方式由互动交流系统数据库提供支持, 其分析类目包括基于活动问题的交流主题和互动频率;活动评价则由作业与考试系统数据库提供支持, 其分析类目包括活动成果的发布和管理以及活动成果评价。图 2 基于大数据的学生个性化分析模型 下载原图4.个性化学习方式的系统支持与分析类目个性化学习方式分析由电子教材系统数据库、数字资源系统数据库、作业与考试系统数据库和互动交流系统数据库提供支持, 其分析类目包含学习目标分析和学习者特征分析两个方面
30、。学习目标分析包括知识与技能、过程与方法和情感态度价值观, 学习者特征分析包括学生的知识基础、认知能力、学习动机和学习风格。在确定学习目标和学习者特征的基础上, 对电子书包中各系统数据库中的相关信息进行分析, 并据此为学生提供个性化学习方式, 其中电子教材、数字资源、作业与考试等系统数据库为讲授式和自主学习提供分析依据, 电子教材、数字资源、作业与考试和互动交流等系统数据库为协作式学习提供分析依据。四、学生个性化分析模型要素的关系框架与实 现路径(一) 学生个性化分析模型要素的关系框架前面对个性化分析模型的构成要素进行了微观分析, 为了清晰展示各要素之间的语义关联, 本研究对电子书包中各系统分
31、析要素的关系及其工作模式进行了分析, 勾勒了学生个性化分析模型要素的关系框架, 如下页图 3 所示。该框架包括学习内容数据库、互动交流数据库和练习评测数据库, 分别收集电子教材系统和数字资源系统语义信息、互动交流系统语义信息和练习评测系统语义信息。各系统数据库对收集的数据信息进行内容分析、互动分 析和评价分析, 并通过分析引擎将分析结果传递到电子学档系统。电子学档系统则对分析结果进行分类处理, 并通过推送引擎采用基于内容推荐、协同过滤推荐和基于知识推荐等推荐方式向不同数据库提交推送信息21, 各数据库将推送的语义信息反馈到所管理的系统, 最终推荐内容会到达各系统中的学习模块层, 从而实现数据信
32、息的收集与推送。(二) 学生个性化分析模型的实现路径前面通过分析得出学生的个性化特征要素包括个性化的学习内容、学习活动、学习方式和学习评价, 而学习活动可进一步分解为活动目标、活动内容、活动方式和活动评价, 因此, 学习活动可由学习内容、学习方式和学习评价要素提供支持。依据学生个性化分析模型以及各要素间的关系框架, 为实现学生的个性化学习, 本研究以个性化学习资源推送、个性化学习过程监控与指导以及个性化学习社区推荐等三个方向为实现路径, 从学习内容、学习方式和学习评价三个方面为学生提供个性化的学习服务。图 3 学生个性化分析模型要素的关系框架 下载原图1.基于学习内容序列节点分析的个性化学习资
33、源推送基于学习内容序列节点分析的个性化学习资源推送的步骤包括样本数据的收集、样本数据的预处理、学习个体的评价分类、主动推动学习资源等。对学习内容序列节点的分析主要是评价学生的知识 掌握情况, 分析指标包括基本情况、认知水平、综合能力和学习评价等, 其中基本情况包括学习基础和已学知识;学生的认知水平着重分析学生对于知识点的理解、识记、应用、分析与综合等;综合能力包括学生学习能力、表达能力、知识应用能力和创新能力等。对学生学习情况评价可采用评价等级, 如优、良、中、差或是给定指标评价分数。通过对学生知识掌握情况的分析, 将同类知识水平的学生进行聚类, 并对这些学生所浏览的学习内容和学习资源数量及分
34、布进行记录, 当记录的数量达到一定的数值并满足统计学原理的要求时, 可以对其学习行为进行预测, 并为该类学生推送满足其个人偏好的学习资源。2.基于练习评测序列节点分析的个性化学习过程监控与指导基于练习评测序列节点分析的个性化学习过程监控与指导步骤包括记录练习评测过程、分析练习评测结果、反馈练习评测信息和提供个性化学习过程指导。其中记录练习评测过程是利用电子书包 中的电子档案袋记录学生练习评测数据节点;分析练习评测结果主要是挖掘学生在练习评测过程中对不同知识点的掌握情况、思考时间和应用层次等; 反馈练习评测信息是通过直观的图表向学习者呈现练习和评测结果, 并依据分析结果推测其知识点的掌握情况;个
35、性化学习过程指导主要是通过对学生学习过程的监控, 结合之前学生练习评测的分析结果, 从知识难点讲解、推荐拓展知识、问题即时答疑等方面对学生给予个性化的指导。3.基于互动交流序列节点分析的个性化学习社区推荐基于互动交流序列节点分析的个性化学习社区推荐步骤包括互动交流文本分析、挖掘学习偏好模式、相似学习者聚类和个性化学习社区推荐。其中互动交流文本分析是对学生在互动答疑和学习社区中的行为 路径进行分析, 并找出具有独立意义的信息单元, 如学习兴趣、学习风格, 形成一个庞大的信息单元库; 挖掘学习偏好模式是依据文本算法将这些信息单元进行组合, 使单元之间产生语义关联, 形成以个人为中心的学习偏好模式;
36、相似学习者聚类是采用聚类法对各信息单元点集进行分析, 并按照距离测度将这些点集聚成多个“簇”, 使具有相似经历、相同兴趣、相似需求的学习者在同一簇中。个性化学习社区推荐是依据分析得到的信息, 为学生推荐合适的学习社区和相关主题偏好的讨论组, 从而使学习者形成较为紧密的虚拟学习共同体。五、结束语随着教育信息化的深入发展, 如何有效地支持教与学、促进学生的个性发展成为教育信息化的核心价值取向, 而近年来迅速发展的大数据技术便凸现出其教育应用价值, 并为记录学生的学习过程、实现学生的过程性评估、促进学生个性化发展提供了可能。本研究以学生个性化特征为理论指导, 以电子书包学习系统中所记录的大数据为信息
37、来源, 构建了基于电子书包大数据的学生个性化分析模型, 并在此基础上设计了学生个性化分析模型要素的关系框架, 这为今后开展基于电子书包的个性化学习分析研究提供了理论框架。本研究下一阶段的探索将以电子书包实验学校为基地, 以学生个性化分析模型为理论指导, 利用电子书包中的电子学档系统记录学生学习过程中的大量结构化、半结构化和非结构化过程数据, 通过组合使用多种大数据挖掘算法对学生学习过程中的个性特征进行挖掘及可视化表征, 并结合实证研究对模型进行验证, 以期从实践层面完善和优化学生个性化分析模型。参考文献1教育信息化十年发展规划 (2011-2020 年) EB/OL.http:/ 2013-12-13. 2祝智庭, 郁晓华.电子书包系统及其功能建模J.电化教育研究, 2011, (4) :24-27.