1、获取教育大数据:基于 xAPI 规范对学习经历数据的获取与共享 顾小清 郑隆威 简菁 华东师范大学教育信息技术学系 摘 要: 教育大数据为教育信息化的发展带来了新的机遇, 而对教育大数据应用的实现首先依赖于对来源广泛的教育数据的获取。在这些有待获取的海量的教育数据中, 学习经历数据作为一种承载着学习者在学习过程中的学习行为、学习活动、学习进程和与之交互的学习环境等教育信息的数据, 蕴含着丰富的学习分析价值。随着相关学习技术的迅速发展, 学习经历的跟踪在技术层面已经得以实现, 但学习经历的复杂性、多样性和数据劣构性等特点阻碍了对其广泛的应用。由美国“高级分布式学习”组织发布的 Experienc
2、e API (xAPI) 规范为破解这一难题提供了可行途径。xAPI 规范利用“活动流”来描述学习经历, 通过Statement 来记录学习经历, 并通过语义定义将其转化为良构且易于扩展的数据, 为大数据背景下学习经历数据的获取提供了指导性的框架, 同时通过实现了接口规范的学习记录仓储 (LRS) 来共享学习经历数据, 由此实现对教育大数据尤其是学习经历数据的获取和共享。关键词: 教育大数据; 学习分析; 学习经历; xAPI; LRS; 作者简介:顾小清, 博士, 教授, 博士生导师;作者简介:郑隆威, 博士研究生;作者简介:简菁, 硕士研究生, 华东师范大学教育信息技术学系 (上海 200
3、062) 。收稿日期:2014-08-31基金:2011 年度新世纪优秀人才计划“基于个人数字终端的信息化创新应用研究:资源、服务及应用实例” (NCET-11-0140) Access to Educational Big Data: Tracking and Sharing the Learning Experience Based on the xAPI SpecificationGu Xiaoqing Zheng Longwei Jian Jing Abstract: Educational big data creates new opportunities for the deve
4、lopment of educational informatization, while the application of it depends on capturing the sources of educational data. Learners learning experience data, which exists in the enormous quantities of educational big data, includes the behaviors and activities generated in the process of learning as
5、well as the interactions within the learning context. With the rapid development of related educational technology, experience tracking technology becomes much more promising. However, the learning experience data is so complicated, diverse and unstructured that it cant be widely implemented and uti
6、lized yet.The Experience API specification released by Advanced Distributed Learning provides a solution. It describes learning experience with activity streams and records experience as statements. The Experience API specification supports the learning experience tracking in the times of big data t
7、o transform the unstructured data into the structured ones that are easy to be extended by defining the semantic meaning. Furthermore, the Experience API specification allows the learning experience data to be shared by Learning Record Store (LRS) , which makes it possible to track and share educati
8、onal big data especially the learning experience data.Keyword: Educational Big Data; Learning Analytics; Learning Experience; xAPI; LRS; Received: 2014-08-31一、引言随着大数据 (Big Data) 的崛起和数据密集科学的发展, 数据已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。在教育领域, 教育大数据的概念越来越多地被提及, 人们用它来定义信息爆炸时代产生的海量教育数据。美国科学基金会提出了教育大数据的研究目标:更好地理解
9、人们在智慧环境下的学习;通过教学设计把创新技术和工具嵌入到学习过程中, 改进学习和测验方式;设计新的技术, 并将其整合到学习环境中。 (Wactla, 2012) 教育大数据在带来机遇的同时, 也意味着多方面的困难和挑战, 其中最突出的挑战是如何获取来源广泛的教育数据。另外, 作为教学活动过程重要载体的数字学习资源, 其中蕴含着丰富的潜在教育数据, 而以这些数字学习资源为载体的学习经历数据, 其可能承载的教育价值, 以及如何发挥这些潜在的教育价值, 还有待进一步研究与挖掘。从技术实现的角度, 这一具有潜力的研究需求, 由于ExperienceAPI 规范的提出及其提供的学习经历数据记录框架,
10、为教育大数据的获取及共享的实现提供了技术基础。Experience API ( 简称 xAPI, 也称 Tin CanAPI) 由美国“高级分布式学习”组织 (AdvancedDistributed Learning, ADL) 于 2013 年发布了 1.0.0 版本。 (Advanced Distributed Learning, 2013) 该规范规定了“训练与学习框架” (Training Wilkins, 2008) 监测学生的学习被认为是高质量教学的核心, 同时也是区别学校、教师是否高效的主要因素之一。 (Cotton, 1988) 监测同样可以应用于在线学习。一个良好的在线教学系
11、统应能够定期监测学习者的学习进程以及测试学习者对知识技能的掌握程度, (Helic et al., 2000) 通过评估和测量学习者的学习经历使教师能够度量学生的响应、反馈以及进度, 以帮助教师从社交、行为、认知的层面感知到远程学习者。 (Galusha, 1998) 这种方式在一定程度上弥补了在线学习中因缺乏正常的人际交流而对学习者造成的妨害。 (Ragan, 1999) (2) 教育大数据背景下学习经历数据的价值大数据在教育领域的具体应用主要有学习分析 (Learning Analytics, LA) 和教育数 据挖掘 (Educational Data Mining, EDM) 。 (B
12、ienkowski et al., 2012) 由于学习是学生与学习内容、学习环境、学习伙伴和教师之间复杂的交互过程, (顾小清等, 2012) 因而教育数据挖掘和学习分析这两个方面应用的基础数据都应是基于学习过程的数据, 既包括学生、学习内容、学习环境、学习伙伴和教师的数据, 还包括学生对各种客观资源的操作数据以及这些因素之间的关系数据。这些积累的学习经历数据蕴含了巨大的分析价值。建立学生学习的数据库来存储学生与学习内容的互动时间和行为, 以及用户知识模拟、用户行为分析、用户经验分析, 这些都是自适应学习环境的组成部分。 (Bienkowski et al., 2012) 学习过程中的学习经
13、历可以在任何地点、任何时间内发生, 例如对学习资源的标注行为、工作中的业务表现、移动学习中与移动应用的交互等。这些学习经历都值得记录, 形成的大数据既可以帮助学习者分析和优化学习经历, 也可以成为教学、销售、人力资源等行业的辅助工具。 (Duhon, 2014) 教师和未来的劳动力市场雇主可以根据学习过程中的数据了解学习者的学习行为特征, 如学习速度、领悟能力、与其他学习者的互动合作等, 以便他们结合学习者的学习经历和学习结果对其进行更加全面的评估。 (张羽等, 2013) (3) 获取学习经历数据的研究现状当前大数据在社会经济学中的应用, 多表现为通过现实生活中的数据挖掘检测复杂的社会系统,
14、 如借助移动终端 (包括传感器、GPS 定位仪、智能手机等) 收集数据, 识别社会情境下用户的日常活动, 并将实时数据与历史数据进行关联, 推测其人际关系。 (Eagle et al., 2006) 学习经历数据的获取方式更类似于这种“实时数据流与历史数据的关联”, 这种数据会以“数据流”的形式高频次地产生, 在获取、记录数据流的同时还需要关联整合历史环境信息, 以实现环境化、个人化的信息空间。传统意义上对学习经历数据的获取通常会忽视对环境信息、个人化信息的处理, (Eaves, 2012) 其数据主要源自描述性的反馈、成绩信息、任务完成情况等教育测量途径。例如, Cotton (1988)
15、提出通过监测学生的表现、作业、测试、评论来收集学生的学习数据。但这种通过口头反馈或书面反馈的测量方式所提供的信息结构松散, 表达不够准确。随着技术的发展, 学者们开始基于在线教学平台采用量化的方式来获取数据, 这种方式通常会事先设置观测点以测得学习者的变化, 并以得分、成长曲线等方式呈现出来, 最终用数据的增益情况量化学习者的进步程度。 (Suen et al., 2012) 例如, Mazza 与 Dimitrova (2004) 利用远程教学平台中课程管理系统生成的日志数据帮助教师了解学生的学习动态, 并利用信息可视化生动地呈现出复杂且多维度的学生数据, 以辅助教师改善教学。为了提高教学资
16、源在不同教学平台间的兼容性和可重用性, ADL发布了 SCORM 标准用于指导学习资源包装, 并使学习管理 系统 (Learning Management System, LMS) 能够跟踪学习者与学习资源交互的数据, 包括成绩、书签信息、完成情况等。但是, SCORM 仅能基于网络会话 (Session) 对学习经历数据进行记录, 其记录的学习经历具有一定的局限, 缺乏持续性及环境化的信息, 并且不适用于移动终端数据的采集和记录。而随着泛在学习环境的不断丰富, 基于移动终端的泛在学习数据的采集不容忽视。同时, 由于 SCORM 中的教育测量方式在概念和操作上都较为简单, 而学习过程中的影响因
17、素非常之多, 要想通过有限的测量结果来完全解释学生的学习过程甚为困难。结合大数据资源的特性, (Global Pulse, 2012) 学习过程中大数据采集的难点主要体现在 5 个方面:一是数字化生成, 即学习经历数据在产生之初就应该是数字化的 (相对于手动数字化) ;二是被动产生, 即当学习发生时, 学习经历数据需要由学习系统自动产生;三是自动采集, 即学习经历数据产生后可以被提取、存储;四是时空上可跟踪, 即需要采集环境信息, 支持非正式学习情境 (如移动学习) ;五是持续分析, 即可对采集的学习经历数据进行实时分析。2.教育大数据的共享数据的获取是教学数据挖掘的核心环节。 (Bienko
18、wski et al., 2012) 大数据应用于教育的前提条件是拥有海量的教育数据。为了使现有的数据资源物尽其用, 最有效的方式就是共享数据。共享不仅有利于加速教育大数据产品的开发, 也有利于降低研究成本。尽管目前已经存在一些具有潜在开发价值的教育数据, 但仍有大量的教育数据难以甚至无法获取, 这样的数据源如同一个个“信息孤岛”, 相互之间功能无法关联, 数据无法共享。造成“信息孤岛”的主要原因包括:数据互操作不易、数据格式缺乏标准、数据服务难以扩展, 以及数据安全及隐私存在隐患。(1) 数据互操作性问题。不同的数据系统之间其数据缺乏互操作性 (Data Interoperability)
19、。所谓互操作性是指系统输入输出的数据流及数据格式可以完全被其他系统所识别、整合和交换, 以便用于数据分析。 (Bienkowski et al., 2012) 尽管目前众多教育领域已经实现了信息化, 但其所部署的系统往往都采用封闭的系统架构, 系统之间相互独立, 因而造成教育数据严重隔离的现象。这些系统包括学生信息系统、教师在线教科书系统、作业提交系统、作业帮助系统以及评价系统等。缺乏数据互操作性问题在其他领域也普遍存在。联合国发布的报告显示, 联合国内部的部门之间都很难做到大数据的共享。 (GlobalPulse, 2012) (2) 数据格式的标准化问题。对大数据的利用就是将劣构、复杂的数
20、据转变成可执行的信息。 (Global Pulse, 2012) 大数据一般可以分为三种类型:结构化数据、非结构化数据、半结构化数据。结构化数据能直接被机器读取并识别;半结构化数据的结构通常是不规则的 (Irregular) 、隐式的 (Implicit) 或不完整 的 (Partial) ; (Abiteboul, 1997) 非结构化数据通常只具有语义结构, 需要通过机器学习 (Machine Learning) 才能对其进行操作, (Bienkowski et al., 2012) 例如对非结构化或半结构化数据进行清洗以及对超大规模数据进行集成。 (祝智庭等, 2013) 此外, 传统的
21、关系型数据库中的数据关系通常由人工提前设计, 而大数据往往是高频率自动产生的、大规模的数字化信息。这些数据通常信息量庞大且多为半结构化或非结构化类型, 被称为原始数据 (Raw Data) 。 (Global Pulse, 2012) 为了能让原始数据转化为可供分析之用的“数据的数据” (Data about Data) , 就需要为这些原始数据提供数据收集模型。但不同的分析需求需要建立不同的模型。例如, 对于相同类型的教育大数据源, 从学习分析的角度可能会倾向于在一开始就收集固定格式的数据, 而从数据挖掘的角度则倾向于尽可能地收集更多的数据以挖掘潜在的模型。这就有可能造成在某些系统中作为重要
22、变量的数据在其他系统中被忽略了, 从而导致数据源难以整合。(3) 数据服务扩展问题。传统的数据公共服务系统往往都是由数据库与数据应用组成, 这种架构一般用于特定的用途和特定的时间, 数据库与数据呈现之间形成紧耦合, 不利于从数据中提取潜在的信息以及适应内部和外部需求的变化。(Eaves, 2012) (4) 数据安全及隐私问题。高度的数据收集和共享机制为各种组织机构间的合作和研究工作提供了巨大便利, 但目前对用户数据的收集、存储、管理和使用等还有很多漏洞。 (冯登国等, 2014) 有些数据由于涉及国家安全、知识产权、个人信息等, 出于对数据安全及隐私的保护而将其进行隐藏, 这在一定程度上影响
23、了教育大数据的共享与实际应用。例如, 尽管目前多家教育服务商已经开始对用户的学习数据进行采集, 但出于对商业竞争力与用户隐私的考量, 服务商往往不会共享所采集到的教育数据。 (GlobalPulse, 2012) 总体来说, 大数据的共享已不仅仅是数据源个体之间交换数据的问题, 而是需要一套完善的数据服务体系, 尤其对于像教育这样的公共事业, 教育大数据的共享需要从数据共享平台和公共服务的角度去考虑。在技术方面, 越来越多的大数据应用开始引入语义技术, 通过语义链接, 使数据的描述更为规范且富含机器可理解的语义。 (刘炜等, 2013) 这种“语义化”的数据, 采用非关系型数据库 (NotOn
24、ly SQL, NoSQL) 进行存储 , 它常以 URI (Uniform Resource Identifier, 通用资源标识符) 作为数据标识, 提供数据共享的媒介, 以使机器能更好地读取这些数据, 从而增强大数据的互操作性。例如, 中国人民大学网络与移动数据管理实验室 (WAMDM) 开发的集成数据库系统ScholarSpace 能够对异构的数据进行抽取和集成, 通过提取关系和实体, 对数据进行关联和聚合, 并采用统一定义的结构对数据进行存储。 (孟小峰等, 2013) 美国金融服务公司 State Street 通过在现有的关系型数据库上添加一个语义映射层, 以此来提高不同数据源的
25、整合效率。 (Tucci, 2012) 在教育领域中, 西蒙斯指出学习分析技术的数据来源包括智能化的数据。所谓智能化数据是指通过语义分析及连接技术来处理的源自课程、学期考试和其他来源的数据。(Siemens, 2010) 例如, “学习注册站” (The Learning Registry) 就是通过对教学者、学习者与在线学习资源交互时产生的元数据和社交型元数据进行的学习分析, 而这些数据可以作为学习资源分析、资源推荐、趋势监测、用户体验监测的数据基础。在策略方面, 越来越多的机构从宏观层面提出了大数据的共享解决方案。例如, 联合国 GlobaPulse (以下简称 GP) 实验室的“大数据基
26、础设施策略” (Global Pulse, 2013) 旨在搭建一个良性的基于大数据开发的研究和宣传环境。合作伙伴可以通过四种方式与 GP 实验室开展合作:一是数据共享, 即通过共享数据集或提供流式数据的存储, 以支持 GP 实验室在各领域的公共研究;二是技术共享, 即提供数据共享、数据挖掘、实时的学习分析与可视化工具;三是专家共享, 即通过共建特定的项目将工程师、数据统计专家、研究者整合在一起;四是资助共享, 即通过提供资金支持, 以支持大数据转变为公共产品。“大数据基础设施策略”要求国家层面的合作伙伴通过上述四种方式向 GP 实验室提供可持续的资源, 实现数据的分享, 以保证开展研究的数据
27、来源。另一个值得关注的例子是美国白宫发布的“数字政府” (Digital Government) , 它从实施层面为大数据平台提供了具体的策略。“数字政府”战略旨在开放公共数据服务, 促进国家的创新, 提高公共服务的 质量。 (American Federal CIO Council, 2012) 该战略明确了未来公共信息服务的概念模型 (见图 1) 。在保障安全和隐私的大背景下, 数字政府被分为三层:信息层 (The Information Layer) 、平台层 (The Platform Layer) 、表现层 (ThePresentation Layer) 。每一层对应不同的服务对象:
28、信息层承载所有信息, 包括结构化的“数据”和非结构化的“内容”;平台层承载所有信息管理的系统及运行, 主要包括网络 API、内容管理系统、公共业务服务等;表现层定义了信息组织和提交给信息消费者的方式, 如网站、移动应用等。信息层和表现层的分布能分离信息本身和表现形式。这种开放数据和内容的做法意味着当需要给客户提供服务时, 可以直接在平台层重复使用相同的网络 API 去完成相同的操作行为。这种分层方式分离了数字信息的创建、传播和呈现。数据的分享主要存在于平台层, 平台层通过定义应用及系统之间的标准规范来实现数据的分享, 有利于提高数字信息的重用并降低成本。而在表现层, 盈利及非盈利组织将政府所开
29、放的信息和数据用不同的表现形式向公众发布。这种低耦合度的方式使数字信息服务更加灵活, 各层专注于各自的责任, 在规范的约束下各层在内部可以不断扩展。例如, 当某个应用功能发生改变时, 只需要改变数据来源接口即可, 而无需对底层数据进行修改。图 1 “数字政府”信息服务模型 下载原图三、Experience API 与教育大数据1. Experience API (xAPI) 概述Experience API 是一种用来存储和访问学习经历的技术 规范。 (Advanced Distributed Learning, 2014a) 它是“训练与学习框架” (TLA) 的一个部分。TLA 并不是一种
30、系统或软件, 而是一种类似 SCORM 的抽象的框架, 用于指导学习系统应用和创建。TLA 包含一套标准化的网络服务规范和开源软件, 旨在创建一个多元的连通训练和学习的环境。 (Advanced Distributed Learning, 2014b) TLA 包含学习经历跟踪 (Experience Tracking) 、内容代理与理解 (Content Brokering and Understanding) 、学习者档案 (Learner Profiles) 、能力网络 (CompetencyNetworks) 四个部分。其中, 学习经历跟踪部分定义了如何跟踪学习者的学习经历数据, 这一
31、部分还有一个重要的功能是允许采集到的学习经历数据在获得授权的系统间实现共享。 (Advanced DistributedLearning, 2014c) 目前, 学习经历跟踪部分包含两个项目, 一个是网络服务规范Experience API (xAPI) 规范;另一个是开源软件项目学习记录仓储 (Learning Record Store, LRS) 。需要说明的是, 尽管 TLA 官方网站中将 xAPI 和 LRS 列为学习经历跟踪部分下的两个项目, 但从逻辑上来考虑, 两者并不是并列的关系。笔者认为, xAPI 规范类似“一张图纸”, 而 LRS则是依照这张图创建的“产品”。xAPI 所跟
32、踪的学习经历可以来自多种学习环境, 包括正式课程、模拟仿真、基于网页或视频的非正式学习、电脑游戏和社交媒体等。其跟踪的数据不仅包括在以上环境中的诸如成绩、作业完成情况等传统学习经历数据, 也包括学习者的行为记录, 如“看了一篇文章”或“观看了一部培训视频”。与 SCORM 必须基于传统 Web 浏览器的特点不同, xAPI 与平台、硬件设备无关, 尤其适用于移动学习。xAPI 不仅能够记录学习活动提供者所创建的学习经历, 也提供了对数据的检索、读取和写入功能, 这使得其他系统在网络环境下能够连接并使用这种服务。xAPI 规范目前以一种分享社区的模式发展着, 由来自全世界的贡献者共同维护。 (H
33、ruska, 2012a) 2.xAPI 与学习经历数据(1) 利用活动流描述学习经历xAPI 利用“活动流” (Activity Stream) 来描述学习经历。 (Hruska, 2012b) 活动流是一种个人在特定网站中的所有活动行为的信息集合, 广泛应用于社交 网站的各 种情境中 ( 如 Facebook、Twitter、人人网等) , 常用来反映社交网站用户的社交行为。这些活动流都遵从活动流规范 (TheActivity Stream Specification) 。活动流规范是开源网络基金会 (Open Web Foundation) 下的一个项目, 由众多网络服务商 (包括 Fa
34、cebook、Twitter、Google) 所支持和维护, 定义了基于 JSON 格式和 XML 格式的 Atom 发布协议 (Atom PublishingProtocol) 。此外, 该项目还初步定义了一些动词和活动, 以辅助人们利用流 (Stream) 来对交互行为进行建模。xAPI 遵从活动流规范, 定义了如何生成和采集学习活动流数据, 并将这些数据组织到有意义的学习情境中。它采用一种可互操作的方法, 通过基于学习的活动流将学习经历数据进行封装。xAPI 采用的活动流主要包含三种元素:预定义的操作者 (Actor) 、预定义的动作 (Verbs) 以及与学习经历相关的活动 (Acti
35、vities) , 这种可交换的活动流数据保持了学习情境的意义。 (Murray et al., 2013) 这三种元素可组合成一组最简洁的活动流格式:。其中, 操作者是活动的作用者, 例如学习者、老师、学习小组;动作代表活动的行为, 例如阅读、观看、教授;对象是操作者交互的对象, 通常指一种学习活动或一种学习对象, 例如一堂课、一项测试、一本书、一部视频。举例来说, 利用这种格式的活动流描述传统学习行为可以是:“我 (Actor) 学习了 (Verb) 二元一次方程课程 (Activity) ”, 而在非正式学习情景中可将学习行为描述为:“小王 (Actor) 回看了 (Verb) 介绍xA
36、PI 的 YouTube 视频 (Activity) ”。在理想的情况下, xAPI 的活动流可以通过这三种元素描述所有领域的经历, 而不仅仅是学习经历。 (Duhon, 2014) (2) 利用 Statement 记录学习经历数据活动流是 xAPI 描述学习经历所遵从的规范, 学习经历最终会以具有语义结构的数据形式存在, xAPI 规范中称之为“Statement”。Statement 是 xAPI 规范定义的核心类型。它包含学习经历的所有属性, 除了上述提到的操作者、动作、对象三种必选属性之外, 还包括结果、环境、时间戳等可选属性 (见表 1) 。表 1Statement 的主要属性 下
37、载原表 Statement 是来自目前学习经历的映射。Duhon (2014) 将 xAPI 中学习经历数据的形成过程分解为三个步骤“经历-事件-陈述” (Experience toEvents to Statements, EES) 。首先, 描述性地总结学习过程中的学习经历, 然后通过选择恰当的动作将学习经历概述转化为一个特定的学习事件, 最后将学习事件映射为一组具有具体语境意义的陈述对象, 从而记录下完整的学习经历。例如, 在技术问答网站 Stack Overflow 中利用 xAPI 可以这样记录学习经历:第一步, 提出用户有哪些经历, 主要包括发布技术问题、回答问题、赞成已有的答案、
38、对答案评分、对答案进行二次编辑、接受答案等。第二步, 对第一步提出的经历进行筛选并概括为一组特定的与学习相关的事件, 包括:在社区中提出一个问题, 表明学习的需求;对问题提交一个答案, 反映回答者对学习需求的帮助;接受一个答案, 说明回答者的帮助解决了学习的需求;接受一个对答案的建议性编辑, 肯定其他参与者对学习帮助的改进。第三步, 将第二步概括出的学习事件映射到 Statement 对象上, 如“提出问题”可以映射为具体的人提问了问题附分组信息问题标签类别类别信息的标识父级问题所在的网站。实例化后即:小王, 一个 StackOverflow 的社区成员提问了“如何解决 Javascript
39、的内存溢出问题?”附分组信息标签:Web 前端, 内存管理, Javascript以及类别“Web 前端问题”父级网站 Stack Overflow。这样一条 Statement 例子完整地描述了一个具体的、有意义的学习经历, 同时也包含了大量的环境信息。这些信息使学习经历更容易被识别且更具可读性:“分组信息”利于主题的识别以及相关内容的关联, “类别”有助于系统对其进行分类, “父级”则定位了发生学习经历所在的环境。图 2 xAPI 可扩展特性示意图 下载原图(3) xAPI 规范中语义的定义学习经历的语义定义并不在 xAPI 的规范之内, 只有极少数的术语由于技术上的必要性而被强制定义,
40、大部分语义都由社区来定义。xAPI 提供了一种可扩展的模式来实现学习经历数据中的语义定义 (如图 2 所示) , 这种模式类似于Facebook 的 OpenGraph 接口 (https:/) 以及Twitter 的 Slang 接口 (http:/) 。在不同的领域中, 动作和活动的含义也会有所差别, 而且随着技术的发展也会出现新的动作、活动。例如, 当出现新的学习情境时, 用户可以根据动作、活动模型扩展出适合新的学习环境的动作、活动, 并且这种动作、活动也能被遵循 xAPI 规范的其他系统所识别。社区驱动使 xAPI 非常强大, 社区所驱动的语义创建能够顺利地融入我们的日常活动, 更贴切
41、地描述隐性的学习经历。 (Mueller et al., 2014) 社区主要对 Statement 中的动作和活动进行语义定义。其中, 动作在描述学习经历中起关键作用。从上述例子的第二步可以看出, 动作决定了学习事件的意义, 反映了学习经历中操作者如何参与学习事件、如何与学习对象交互。与此同时, 为了让 xAPI 数据在系统之间能够传播和交换, 各系统间需要共享一套动作定义, 这套动作定义应该是普遍适用的, 而且用户可以直接重用这些动作。目前, ADL已经基于 Schema.org 框架定义了一套适用于学习经历的动作, 这些动作来自多种已存在的学习活动, 包括在线课程、游戏、现实世界、视频、
42、图片、论文、博客等。 (Hruska, 2012a) 但需要指出的是, 这些动作集合并不包含在 xAPI规范的范围之内。此外, 动作定义的筛选策略也能反映出对学习经历跟踪的粒度 (Granularity) 。并非所有粒度级别的学习经历都有必要概括为学习事件, 筛选策略应该由数据的使用需求所决定。例如, 在在线视频学习环境下, “播放”、“暂停”、“调节声音”等简单动作并不具有太多记录价值, 而“回看视频片段”、“关闭时是否看完视频”等学习事件中所发生的动作对于学习分析则更具分析价值。Duhon (2012) 指出, 具体的动作定义有助于系统明确发生的学习行为, 而过度宽泛的动作定义会降低学习经
43、历数据的有效性, 使系统需要获取更多的数据来分辨动作在不同语境下的准确含义。3.基于 LRS 的学习经历数据的获取与共享(1) LRS 概述xAPI 规范不仅定义了如何记录学习经历数据, 也定义了学习经历数据存储、检索的规则。开发者只要实现了这些规则, 便可以创建基于 xAPI 的学习经历跟踪服务, 这种服务可以安全地存储 Statement 并将其传输到其他特定的系统中。 (AdvancedDistributed Learning, 2014d) 这种存储学习经历信息的系统被称为学习记录仓储 (Learning Record Store, LRS) , 它通过 xAPI 定义的接口来交换 Statement 对象。LRS 是对 xAPI 规范的实例化, 主要体现在将 xAPI 规范中抽象的接口实现为具体的网路服务。LRS 可以通过这些服务来收集、返回