1、在线学习行为特点及其影响因素分析研究*魏顺平( 中央广播电视大学 现代远程教育研究所 , 北京 100031)【摘要 】 中央广播电视大学和全国不少网络教育学院的网上教学检查表明 , 学生在线学习时间投入普遍偏低 。已有研究表明 , 网络资源和学习支持服务等两个外部因素是影响学生在线学习投入的重要因素 。本研究以中央电大开放教育入门课程 “开放教育学习指南 ”网络课程为例 , 以 2010 年春季学期江苏电大 9369 名新生学习该课程时所产生的登录数据 、资源浏览数据和形成性考试数据为分析对象 , 采用数据挖掘的方法得出登录 、资源浏览 、作业 、测试等在线学习行为的特点及其影响因素 。【关
2、键词 】 在线学习 ; 行为特点 ; 影响因素 ; 数据挖掘【中图分类号 】G434 【文献标识码 】A 【文章编号 】1007-2179( 2012) 04-0081-10*基金项目 : 本文系 2011-2012 年度联校教育社科医学研究论文奖课题 “远程学习者在线学习行为特点及其影响因素研究 ”( 编号 : JY11043)成果 。一般而言 , 在线学习是指通过因特网进行学习与教学的活动 。在本文中 , 在线学习指的是发生在网络教学平台上的学习 , 要比一般意义上的在线学习 ( 以及与之近义的 e-Learn-ing、网络化学习 、数字化学习 ) 的外延要窄 。本研究所关注的在线学习行为
3、特点描述及其影响因素分析主要基于学习者在教学平台上留下的各种行为记录以及学习者的基本信息 。研究远程学习者的在线学习行为特点 , 并发现影响这些行为的关键因素 , 将有助于远程教师及管理人员了解当前学习者的总体学习状况 , 为他们开展相关决策 , 如优化教学平台和教学资源 、改进学习支持服务提供有力参考 。目前 , 有关在线学习行为描述与影响因素分析的研究围绕在线学习行为描述 、影响因素分析及相关监控软件开发应用等展开 。这些研究采用文献研究 、问卷调查 、访谈 、网络日志分析 、内容分析等方法对学习者的学习行为 、参与度以及影响参与度的因素进行研究 。从已有研究来看 , 不少研究通过分析教学
4、平台网络日志来描述在线学习行为 。例如 , 谢维奇 ( 2004) 采用数据挖掘方法对 Web 服务器日志和后台数据库进行挖掘 , 一方面为教师及时提供学员的访问次数 、访问时间 、教学资源的利用情况 , 另一方面为网站的管理者提供用户的浏览模式信息 , 分析使用者的访问路径 , 从而使教师对学员的学习过程能实施有效的监控 , 完成对学员的形成性考核 , 并完善网站设计 。宋江春等 ( 2005) 提出使用挖掘技术分析学生的访问行为 、频度 、内容 、停留时间等内容 , 得出学生访问行为和方式的一般模式 , 并以此为依据向学生提供全面的个性化教学支持服务 。袁明等 ( 2006) 则以一所网络
5、教育学院教学平台学习记录为挖掘对象 , 设置课程页面点击次数和上网人数两个参数 , 结合时间和地域特点 , 对已上网人数 、每天访问在线课程人数及其月平均值 、访问量时段特点 、各地区 ( 以下称为站点 ) 学习者到访比例和在线测试题完成情况等方面进行分析研究 。有研究人员将关联规则挖掘技术用于从用户访问序列数据库的序列项中挖掘出相关的规则 , 揭示学习者访问一些内容的同时会访问哪些内容 , 借此找出具有相关内容的网页 , 从而更好地组织课程页面和推荐页面 , 尽可能缩短相关内容的分布距离 , 或提供便捷的路径指引 ( Ha et al , 2000;Wang, 2002) 。Romero 等
6、 ( 2005) 曾采用统计 、可视化 、分类 、聚类以及关联规则挖掘等数据挖掘方法对 Moodle 平台中的各种数据进行分析 , 得到的分析结果可为学生了解自己的学习状况 、教师监控学生的学习状况提供参考 , 并为教师的教学决策提供依据 。上述研究成果可为本研究的开展提供挖掘内容和挖掘方法参考 。已有研究表明 , 在线学习行为的影响因素主要有网络资源和学习支持服务 。赵丕元 ( 2002) 通过对 2000 名中央电大开放教育试点学生的问卷调查发现 , 影响学生参与网上学习的不利因素有 : 网上资源内容尚不够丰富 、网页形式呆板 , 有些课程辅导缺乏交互性 、网页内容更新较慢 ; 学习支持服
7、务不够便捷 。龚志武 ( 2004) 指出 , 网络课程结构体系相对完整 , 学生网上学习时间和次数就会相应增长 ; 师生网上交互率的高低与学生网上学习的时间和次数成正比 , 即交互率越高 , 上网次数越多 , 学习时间也越长 。肖爱平等 ( 2009) 指出在线学习的影响因素具体包括网络环境 、课程资源 、网上交互以及学习者自身的原因 。此外 , 在线学习行为分析的实际应用就是建立在线学习行为监控系统 ( 毛利杰等 , 2009; 杨金来等 , 2008; 邵艳丽等 ,18第 18 卷 第 4 期2012 年 8 月开放教育研究Open Education ResearchVol18, No
8、4Aug2012DOI:10.13966/ki.kfjyyj.2012.04.0122008) 。网络学习中的监控机制对于促进网络学习这种新型的学习方式的普及和发展 、提高网络学习质量具有重要意义 。其中 , 杨金来等 ( 2008) 所设计开发的监控系统涉及来访客户端信息统计 、不同地域学习者在线分布情况 、学习者在线人数的实时统计 、学习者个体网络学习行为的实时监控等 。综合上述已有研究 , 笔者认为 , 基于网络日志的学生行为分析还可以更加细致深入 , 可以从学习时间 、学习活动 、师生交互 、学习资源 、考试成绩等多个角度发现更多的学习行为特点 ; 影响因素分析还可更加注重内在因素 ,
9、 即学生自身因素的分析 。本研究将采用网络日志分析这一非反应性研究方法以及相关分析 、差异检验 、聚类分析 、社会网络分析等数据挖掘方法 , 对在线学习的网络日志做出更为细致深入的分析 , 并探索在线学习行为的内在影响因素 。课程概述与研究样本选取“开放教育学习指南 ”是中央广播电视大学开放教育专科和专科起点本科各专业学生的必修课 , 也是开放教育学生的入门课程 。该课程配有文字教材和网络课程 。基于网络课程的 “开放教育学习指南 ”课程试点工作已在江苏电大 、天津电大以及中央电大直属学院开展 。由于是网络课程试点 ,所有学生均需登录电大在线平台 ( http: / /www openedu
10、comcn/) 进行学习 , 这样保证了后面所获得的学生网上学习过程记录是完整的 。本文选择 “开放教育学习指南 ”网络课程的在线学习过程数据作为研究样本 , 这些数据包括学生在使用电大在线平台时产生的登录 、资源浏览 、学习体验等数据以及学生在使用形成性考试平台时产生的考试成绩数据 。为了开展影响因素分析 , 研究者还从教务管理平台中采集了学生基本信息数据 。最终 , 研究者从三个不同的平台中获得了江苏电大参加 2010 年春季 “开放教育学习指南 ”网络课程试点的学生的基本信息数据 、登录数据 、资源浏览数据和形成性考试数据等 , 并导入数据库 , 形成四张数据表 。这四张数据库的关联通过
11、 “学号 ”这一字段来建立 。经联合查询 , 这四张数据表的学生数并不一致 , 为了能对所有学生做一个完整的学习过程分析 , 作者对这四张数据表进行交集运算 , 取得这四张数据表中共有的学生 , 共计 9369 名 。本研究即以这9369 名学生对应的基本信息 、登录 、资源浏览和考试成绩等四类数据作为分析对象 , 开展远程学习者在线学习行为特点及其影响因素研究 。参加该网络课程学习的学生分为本科 、专科和 “课程开放 ”三个专业层次 。其中 , “课程开放 ”属于一种以课程为单元的开放学习形式 , 即允许学习者注册单科学习课程 。这三种专业层次的学生分布情况如表一所示 。我们以 5 年为一个
12、单位 , 将学生年龄分为若干段 , 然后统计得到各年龄段学生的数量分布 , 其结果如表二所示 。学生集中在 15 34 岁之间 , 这四个年龄段的学生数占样本总数的 83%。表一 2010 年春季江苏电大参加试点的学生专业层次分布专业层次 男 女 总计课程开放 687 424 1111本科 1724 1974 3698专科 2748 1812 4560总计 5159 4210 9369表二 各年龄段学生分布年龄段 本科 课程开放 专科 总计15 19 1 950 528 147920 24 1350 120 1730 320025 29 1035 15 717 176730 34 686 12
13、 636 133435 39 369 7 397 77340 44 193 7 341 54145 49 56 165 22150 54 8 38 4655 59 7 7不可知年龄 1 1总计 3698 1111 4560 9369学生登录行为描述与影响因素分析通过对登录行为数据表做各种查询操作 , 可得到学生登录的基本情况信息 , 如表三所示 。表三 登录基本情况学校名称学生总数平均登录次数最大登录次数平均登录天数最大登录天数江苏广播电视大学9369 7 169 3 天 56 天在登录行为数据表中 , 学生学号和登录时间是两个主要字段 。下面笔者分别以登录时间 ( 分 “周 ”、“天 ”、“
14、小时 ”等统计单位 ) 作为分类字段 , 统计各个时段学生的登录人次 ; 以学生学号为分类字段 , 统计每个学生的登录天数 。本文不以学生的登录次数为计数单位 , 而是以某个时间单位的登录人数来统计 。这是因为如果以登录次数来统计可能会由于个别学生的反复登录而造出学生学习强度大的假象 。而登录人数能真实反映某天的学生整体活动程度 。这里引入一个术语即登录率 , 作者将登录率定义为 “登录率等于某一时间登录平台的学生数除以学生总数 ”。( 一 ) 以登录时间为分类字段的统计分析1 以 “周 ”为单位统计每天的登录人数以 “2010-3-17”( 课程开学日 ) 所在周为第一周 , 接下来各周的起
15、止结束时间如表四所示 , 一共有 15 周 。笔者按周计算登录率 , 即 “一周内学生登录的人数除以学生总数 ”, 并28魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)绘制 “学习时间 -周登录率 ”直方图 , 如图 1 所示 。由图 1 可知 , 自开学后第 4 周起才陆续有学生登录网络课程进行学习 , 随即在第 5 周 、第 6 周达到学习参与的高峰 。自第 9 周起 , 学习登录率开始下降 。除了学生登录率较高的 4 个周外( 如第 5 周 、第 6 周 、第 7 周和第 9 周 ) 以及极低的 3 个周 ( 第1 周至第 3 周 ) , 其他各周的登录
16、率在 10%至 20%之间 , 相差不大 。可以说 , 在整个学期 , 学生群体的学习是比较分散的 。表四 课程学习周期的各周及起止时间相对周序 周开始时间 周结束时间1 2010-3-14 2010-3-202 2010-3-21 2010-3-273 2010-3-28 2010-4-34 2010-4-4 2010-4-105 2010-4-11 2010-4-176 2010-4-18 2010-4-247 2010-4-25 2010-5-18 2010-5-2 2010-5-89 2010-5-9 2010-5-1510 2010-5-16 2010-5-2211 2010-5-2
17、3 2010-5-2912 2010-5-30 2010-6-513 2010-6-6 2010-6-1214 2010-6-13 2010-6-1915 2010-6-20 2010-6-26图 1 各周学生登录率2 以 “周 ”为单位统计发现群体学习的周期对于学生个体而言 , 其学习周期是不确定的 。但是从教学者的角度 , 有必要了解整个学生群体的学习周期 , 即通过登录平台的记录 , 查明多长时间内整个学生群体都会登录参与学习 , 这可以用来衡量群体在线学习开展的速度 。另外 ,教学者还需要了解 , 随着学习时间的推移 , 有多少学生不再来学习了 , 这可以用来衡量群体在线学习终止的速度
18、 。通过对每周累计登录率的统计绘制学生的学习周期 , 得到如图 2所示结果 。由图 2 可知 , 直到开学第 6 周 , 才有 50% 的学生参与了学习 。直到最后一周 , 所有学生才完成了一遍学习 。这反映了学生整体开展在线学习的速度是很慢的 。这就提醒教学者必须加以干预 , 如在第 2 周就应该督促学生登录平台参加学习 。图 2 学生累计登录率的时间分布下面通过对每周累计流失的学生率的统计绘制学生的流失曲线 , 得到如图 3 所示结果 。如图 3 所示 , 到 11 周 , 已有 52%的学生不再来学习了 。这一发现对于在不同时间合理分配教学资源有一定的指导意义 。图 3 学生流失曲线3
19、以 “天 ”为单位统计每天的登录人数前面以周为统计单位发现了群体学习的分散性 , 这种分散性还会表现在以更小的时间单位作为分类统计对象上 。接下来以天为单位进行时间分布特点考察 。研究者通过计算学生每天的登录率 , 绘制了 “学习时间 -登录率 ”直方图 , 得到如图 4 所示结果 。同时列出单日登录率较高的几天的数据 , 如表五所示 。由图 4 可知 , 在这个学习时段中 , 如果将学生日登录率不低于 5% 作为全体学生积极参与学习的标准 ,那么仅有 26 天时间里学生表现活跃 。整个学习时段有 103天 , 除去 30 天休息时间 ( 15 周 ) , 仍然有 73 天的学习时间 。因此
20、, 学生整体活跃的时间只占整个学习时段的 1/3。不过从另外一方面看 , 就群体角度而言 , 学生的在线学习时间是比较分散的 。笔者再以一周中的七天为分类统计项 , 计算学生登录率 , 得到如图 5 所示结果 。如图 5 所示 , 学生分散在一周中的不同天学习 。周六 、周日的学习人数与工作日相当 , 并且在周日参与学习的学生比率最高 , 这体现了在职成人学习的特点 , 即利用节假日开展学习 。38魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)图 4 “学习时间 -登录率 ”直方图 ( 以天为单位 )表五 单日登录率排名日期 日登录人数 日登录率2010-4-
21、18 979 104%2010-4-11 883 93%2010-4-17 842 89%2010-4-19 788 83%图 5 一周中的登录时间4 以 “时段 ”为单位统计每个时段的登录人数接着我们再以时段 ( 分为凌晨 0000 600、上午 600 1200、下午 1200 1800、晚上 18 00 00 00 等四个时段 )为统计项 , 计算这四个时段的登录率 , 得到如表六所示结果 。由表六可知 , 学生的学习时段主要有上午 、下午和晚上三个时段 , 并且这三个时段的登录率相当 , 下午这一时段的登录率略高一些 。表六 学习时段分布时段 登录学生数 登录率凌晨 412 00439
22、75上午 5627 0600598下午 6628 0707439晚上 5592 0596862( 二 ) 以学生学号为分类字段的统计分析前文以各种时间单位为分类字段统计得出在线学习中群体学习时间分散的特点 。下面再以学生个体为分类字段进行统计 , 将会发现个体学习时间投入过少的特点 。对于每个学习个体来说 , 都应该保证一定的学习时间 , 这样才能完成必要的学习任务 。“开放教育学习指南 ”作为 1 学分的课程 , 其规定的学时是 18 学时 , 如果按照线上考核和线下考核以 7 3 的比例分配的话 , 笔者暂将线上学习和线下学习的学时也按照 7 3 的比例进行分配 , 那么线上学习的学时应该
23、是 126 学时 。假设每个学生某天登录平台 , 其学习时间平均为 2 个学时的话 , 那么一个学生应该至少有 6 天登录平台参加学习 。但事实并非如此 。笔者首先查询得到每个学生有登录记录的天数 , 然后计算每类天数对应的学生数 , 最后建立累计学生数与登录天数的函数 , 如公式 ( 1) 所示 。RS( ti) =n1S( ti) /S0公式 ( 1)其中 , S0表示学生总数 ; t 表示登录天数 , 笔者将所有学生的登录天数按从高到底顺序排列并从 1 开始编号 , ti即第 i个登录天数 ; S( ti) 表示第 i 个登录天数对应的学生数 ; RS( ti) 则表示截止到第 i 个登
24、录天数 , 累计学生数占学生总数的比例 。依照此公式以及实际数据 , 作者绘制得到了如图 6所示的曲线 。由图 6 可知 , 登录天数不少于 6 天的学生数不及学生总数的 20% ( 有 1420 名学生 , 占学生总数的 152%) 。只有约 3%的学生 ( 258 名 ) 的学习天数 ( 指有登录记录的天数 ) 不低于整个学习时间的 10% ( 11 天 ) , 而有近80%的学生 ( 786%) 的学习天数在 4 天及以下 , 50% 的学生的学习天数在 2 天及以下 。这就反映出 , 大部分学生 ( 超过80%) 未能投入必要的学习时间开展学习 。图 6 登录天数与累计学生数的关系曲线
25、笔者更为关注登录天数仅为 1 2 天的学生群体 ( 共计4619 人 ) , 造成这些学生学习时间投入少的原因可能有两个 , 一是学生已经掌握了所需内容 , 无需投入过多时间学习 ;二是学生没有认真学习 。我们有必要从 “专业层次 ”、“性别 ”、“年龄 ”等学生属性进一步了解这些学生的特点 。所采用的方法是 Microsoft 关联规则算法 , 以发现这 4619 位学生中三类属性组合的频繁项 。笔者采用 SSAS( SQL Server A-nalysis Services) 部署挖掘结构和挖掘模型 , 将支持度设为 005, 即每一属性组合对应的学生数不少于总人数的 5%, 得到的 3-
26、项集 , 如表七所示 。这一人群存在于各个专业层次 , 其中男性略多于女性 , 以 29 岁以下年轻人为主 。另外 , 从整个学生群体来看 , 随着登录天数的减少 , 对应的学生数成倍增长 。笔者发现 , 在一些登录天数范围内 ( 如1 天至 16 天 ) , 不同登录天数对应的学生数之间存在倍数关系 , 即登录天数每减少一天 ( 或两天 ) , 减少之后的天数对应的学生数就会增加 1 倍 , 用公式可以简单表示为 :48魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)表七 登录天数少的学生群体主要特征项集维度项集 学生数3 专业层次 = 专科 , 年龄值 22
27、, 性别 = 男 5023 专业层次 = 专科 , 年龄值 =22-29, 性别 = 男 4993 专业层次 = 本科 , 年龄值 =22-29, 性别 = 女 4693 专业层次 = 本科 , 年龄值 =22-29, 性别 = 男 4553 专业层次 = 课程开放 , 年龄值 22, 性别 = 男 4053 专业层次 = 专科 , 年龄值 22, 性别 = 女 3073 专业层次 = 课程开放 , 年龄值 22, 性别 = 女 2813 专业层次 = 专科 , 年龄值 =29-36, 性别 = 男 247合计 3165S( ti-1) = S( ti) * 2 + a 公式 ( 2)这一公式
28、可通过如表八所示的数据加以验证 。如表八所示 , 笔者将登录天数两两进行合并 , 如 “1 天 ”和 “2 天 ”合并为 “15”天 , “3 天 ”和 “4 天 ”合并为 “3 5 天 ”, 以此类推 ,然后通过 “S( ti-1) /S( ti) * 2”的计算来得到倍数关系 。可以发现 , 这些倍数在 2 左右摆动 。这种现象类似于无尺度网络现象 。张超等 ( 2009) 曾对两个网络学习课程班的异步交互网络进行比较分析 , 结果发现学习者接近自然条件下 ( 即缺少教师干预 ) 的在线交互行为构成无尺度网络 , 而强学习干预手段的实施使得学习者交互行为发生改变 。由此 , 我们可以推测
29、, 产生登录天数对应的学生数呈偏态分布的原因可能是由于该网络课程的开展缺少教师的干预 , 学生在放任状态下学习 。表八 登录天数对应的学生数序号 登录天数 登录天数均值 对应学生数总和 倍数关系11615155 3521413135 53 151428631211115 112 2113208410995 253 225892958775 447 176679866555 1049 234675674335 2698 257197382115 4619 1712009( 三 ) 影响学生登录天数的因素接下来笔者拟采用相关分析 、差异检验 、回归分析等方法 , 以发现影响学习者学习时间投入的相关
30、因素 。分析工具采用 SPSS130。这里的因变量是学生的登录天数 ( 即某个学生有登录记录的天数 ) , 自变量则是学生的基本属性 , 包括年龄 、性别和专业层次 。1 登录天数与年龄段之间的关系对表二所划分出的各年龄段学生对应的登录天数做描述性统计 , 得到如表九所示结果 。表九 各年龄段学生登录天数的描述性统计年龄段 N Mean Std DeviationStd ErrorMinimumMaximum15 19 1479 29932 350738 09120 100 440020 24 3200 32413 333630 05898 100 520025 29 1767 35750 3
31、24236 07713 100 400030 34 1334 38111 352532 09652 100 560035 39 773 38629 353580 12717 100 410040 44 541 41442 375715 16153 100 400045 49 221 41312 341999 23005 100 180050 54 46 35217 287316 42362 100 150055 59 7 27143 111270 42056 100 400合计 9368 34716 343141 03545 100 5600接着 , 笔者对各年龄段学生的登录天数做差异检验 ,
32、 采用 One-way ANOVA 单因子变异数分析方法 , 得到如表十所示结果 。由表十可知 , 年龄较小的学生 ( 低于 25 岁 ) 与年龄较大的学生 ( 不低于 25 岁 ) 的登录天数均值存在显著差异 ,年龄较大的学生 ( 不低于 25 岁 ) 的平均登录天数多于年龄较小的学生 ( 低于 25 岁 ) 的平均登录天数 。表十 各年龄段之间的差异平均数差值年龄段年龄段15 1920 2425 2930 3435 3940 4445 4915 19 025058( * )082( * )087( * )115( * )114( * )20 24 025033( * )057( * )06
33、2( * )090( * )089( * )25 29058( * )033( * )024 029 057 05630 34082( * )057( * )024 005 033 03235 39087( * )062( * )029 005 028 02740 44115( * )090( * )057 033 028 00145 49114( * )089( * )056 032 027 001* The mean difference is significant at the 05 level各年龄段与对应的登录天数均值的相关分析结果表明 ,二者存在明显的正相关 , 如表十一所示 。
34、这里为排除干扰 ,在计算相关性时剔除了学生样本较少的年龄段 , 如 50 5458魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)和 55 59 两个年龄段 。表十一所示的计算结果表明 , 随着年龄段的增长 , 各年龄段的学生的学习投入时间在不断增加 。表十一 相关分析登录天数均值 年龄段登录天数均值 1 973( )年龄段 973( ) 1Correlation is significant at the 001 level ( 2-tailed) 2 登录天数与性别之间的关系对不同性别学生的登录天数的差异检验结果显示 , 不同性别学生的登录天数存在显著差异
35、。如图 7 所示 , 独立样本t 检验结果显示 , 不同性别的学生在 “登录天数 ”方面存在显著差异 ( 由于 F 值达到显著 , t 值取 “Equal variances not as-sumed”列之 t 值 , 此时 t = -6 047, Sig 0 05,) , 女生的平均登录天数多于男生的平均登录天数 。表十二 不同性别学生的登录天数统计登录天数性别样本数 均值 标准差 标准误男 5159 32789 345810 04815女 4210 37081 338355 05215图 7 独立样本 t 检验结果3 登录天数与专业层次之间的关系通过对学生的登录天数按照专业层次 ( 本科
36、、专科和课程开放三类 ) 分组做差异分析 , 采用 one-way ANOVA 单因子变异数分析方法 , 结果发现不同专业层次之间的登录天数存在显著差异 , 如表十三和表十四所示 。如表十四所示 , 由单因子变异分析结果可知 , “课程开放 ”学生与 “本科 ”学生在“登录天数 ”方面存在显著差异 , “课程开放 ”学生与 “专科 ”学生在 “登录天数 ”方面存在显著差异 , “本科 ”学生与 “专科 ”学生在 “登录天数 ”方面不存在显著差异 。本科 、专科学生的平均登录天数多于 “课程开放 ”学生的平均登录天数 。表十三 不同专业层次学生的登录天数统计N Mean Std Deviatio
37、n Std Error MinimumMaximum本科 3698 36022 311765 05127 100 5600专科 4560 35605 386449 05723 100 5200课程开放1111 26733 221957 06659 100 3200总计 9369 34718 343126 03545 100 5600学生资源浏览行为描述与影响因素分析“开放教育学习指南 ”网络课程包含课程各章节 、体验区 、视频资源库 、问题库 、资料库和常用工具库等内容模块 ,这些模块是学生开展学习的主要对象 , 其内容分布在若干网页上 。每个网页均有记录打开页面和关闭页面的功能 , 最终形成
38、页面浏览日志 。笔者依据页面浏览日志统计分析该课程各模块的浏览情况和不同模块中各页面的浏览情况 , 以发现各类资源的使用情况并分析影响资源使用的相关因素 。如表十五所示 , 是网络课程各模块的一个说明 。表十四 单因子变异数分析结果( I)Level( J)LevelMeanDifference( I-J)Std Error Sig 95% Confidence Interval本科专科 04169 07683 930 -1418 2252课程开放92895( * )08404 000 7282 11297专科 本科 -04169 07683 930 -2252 1418课程开放88726(
39、* )08780 000 6775 10970课程开放本科-92895( * )08404 000 -11297 -7282专科-88726( * )08780 000 -10970 -6775表十五 “开放教育学习指南 ”课程各模块说明模块名称 模块说明课程各章节 网络课程主体模块 , 包含有 61 个章节内容页面体验区 模拟网络平台使用过程 , 有 7 个过程模拟页面视频资源库 列出了课程各章节模块出现的视频资源问题库 列出了网络学习中存在的常见问题资料库 列出了开放教育的一些教学管理文件常用工具 列出了网络学习中可能用到的一些工具( 一 ) 以课程各模块为分类字段的统计分析表十六是 “开
40、放教育学习指南 ”网络课程各模块的浏览情况 。被浏览的资源页面个数 : 通过页面浏览日志数据统计得到的各模块页面个数 , 可能少于各模块实际包含的页面数 。单个页面浏览频次均值 : 由 “浏览频次 /被浏览的资源页面个数 ”算式得来 , 反映该模块各资源页面的使用程度 。浏览学生数 : 通过页面浏览日志数据统计得到的浏览各模块的学生数 。学生参与率 : 由 “浏览学生数 /学生总数 ”算式得来 , 用来反映该模块被学生关注的程度 。人均浏览频次 : 由 “浏览频次 /浏览学生数 ”算式得来 ,用来反映学生在该模块的学习程度 。单个资源人均浏览频次 : 由 “人均浏览频次 /被浏览的资源页面个数
41、 ”算式得来 , 用来反映学生在该模块各资源页面的学习程度 。68魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)表十六 网络课程各模块浏览情况模块名称被浏览的资源页面个数浏览频次单个页面浏览频次均值浏览学生数 学生参与率 人均浏览频次单个资源人均浏览频次课程各章节 103 809797 786211 9230 099 8774 085体验区 9 206720 2296889 9049 097 2284 254视频资源库 37 36978 99941 4321 046 856 023问题库 6 34889 581483 3262 035 1070 178资料库
42、49 15843 32333 2761 029 574 012常用工具库 11 634 5764 382 004 166 015如表十六所示 , 从模块的被使用程度和被学生关注的程度来看 ( “浏览频次 ”列和 “学生参与率 ”列 ) , 由高到底依次是课程各章节 、体验区 、视频资源库 、问题库 、资料库 、常用工具库 , 这恰好是这些模块在课程首页由上而下呈现的顺序 。由此可见 , 模块在页面中的布局对于模块的被使用程度有重要影响 。对于网络课程界面设计的意义则在于 , 要想使某个模块得到学生关注 , 应该将其置于首页的显著位置 。从学生对不同模块各个资源页面的学习程度来看 ( 观察“单个
43、资源生均浏览频次 ”) , 由高到底依次是体验区 、课程各章节 、问题库 、视频资源库 、资料库 、常用工具库 。学生对体验区 、课程各章节各资源页面的学习程度高应该是受到了作业 1 和作业 3 的导向作用影响 。相比之下 , 体验区的学习程度更高一些 , 每个学生对体验区的每个页面的浏览次数平均为 254 次 , 而课程各章节的单个资源生均浏览频次则在 1次以下 。产生这一差异的原因应该是 : 体验区采用一种模拟学习方式 , 以互动的方式让学生掌握网上学习技能 , 应该更能引发学生的学习兴趣 , 吸引学生反复学习 。对于其他四个非作业要求的模块来说 , 学生对问题库的学习程度明显高于其他三个
44、模块 , 说明学生有较强的通过常见问题库来解答初入学的各种疑问的需求 。今后应该进一步丰富问题库 , 并将问题库的检索框置于首页的显著位置 , 以便及时 、方便地解答学生的各种疑惑 , 以帮助学生尽快进入开放教育之门 。视频资源库模块被学生关注的程度不高 ( 学生参与率为046, 即不到一半的学生浏览了该模块 ) , 视频资源库模块中的各个视频资源的被学习程度也很低 ( 单个资源人均浏览频次为 023) 。由于视频资源模块中的各个视频资源都是课程各章节内容页面的一部分 , 如果学生认真花时间学习课程各章节页面的话 , 应该会观看页面上的视频资源 。但是浏览视频资源模块的学生比例只占浏览课程各章
45、节模块的学生比例的一半不到 , 而具体到模块中的各个页面 , 视频资源模块的学习程度也要显著低于课程各章节模块的学习程度 。这只能说明学生对课程各章节的学习并不彻底 , 很多资源特别是视频资源都没有看 。龚志武 ( 2004) 通过对学生的调查发现 , 流媒体课件 ( 即本文中的视频资源 ) 不能单独发挥作用 , 它必须紧密地与课程内容相结合 , 与导学指引相结合 , 与网络教学环境相结合 , 才能真正发挥作用 , 否则就成为摆设 。因此 , “开放教育学习指南 ”网络课程的视频资源未能得到充分应用 , 其原因很可能在于这些视频资源未能很好的与课程内容相结合 , 课程设计还需加以改进 。( 二
46、 ) 以学生学号为分类字段的浏览行为统计分析该课程有三个作业 , 这三个作业通过浏览模块 “课程各章节 ”和 “体验区 ”来完成 。据统计 , 这两个模块有实际内容( 目录页除外 ) 的资源页面分别为 61 个和 7 个 。另外 , 视频资源库中的 28 个视频实际上是 “课程各章节 ”模块的重要组成部分 , 应该成为在作业 1 中完成的内容 。综上 , 形成性评价所要求浏览的 、有实际内容的资源页面共计 96 个 , 笔者将这些资源定义为 “有效资源 ”。下面就以各个学生为统计项 ,调查他们对这 96 个有效资源的浏览情况 , 以发现学生在使用资源程度的分布情况以及时间分散特点 。表十七是学
47、生浏览有效资源的基本情况 。表十七 学生浏览有效资源基本情况学生参与数 9231 人学生参与率 0985未浏览资源人数 138 人人均浏览资源天数 2 天最大浏览资源天数 35 天浏览资源天数 ( 累计 ) 18852 天登录天数 ( 累计 ) 32527 天人均浏览资源数 68 个浏览资源数众数 68 个最大浏览资源数 96 个人均浏览资源频次 84 次最大浏览资源频次 970 次由表十七可知 , 在所有有登录记录的学生中 , 仍然有 138人未浏览任何有效资源 , 即这些学生的在线学习没有发生 。从人均浏览资源天数和最大浏览资源天数来看 , 这二者均小于与之相应的平均登录天数和最大登录天数
48、 。另外 , 比较学生浏览有效资源的天数 ( 累计为 18852 天 ) 和学生登录的天数 ( 累计为 32527 天 ) , 前者为后者的 58%, 这说明学生在有近一半的 “学习日 ”( 学生进入平台的日子 ) 只是路过平台而已 , 并没有发生有效的学习 , 也表明学生在开展在线学习过程中有缺少计划 、随意中止的特点 。从登录天数来看 , 学生有意来学习并登录平台的时间是很有限的 , 如平均登录天数为 3 天 , 近 80%的学生 ( 78 6%) 的学习天数在 4 天及以下 。在这有限的登录天数里 , 又有一半的时间放弃了学习 , 这是非常可惜的 。如果不能抓住每一次登录时间及时学习 , 势必会导致最后的突击学习 , 即在 1 2 天内浏览完所有有效资源 。这一突击学习的特点将在后面加以验证 。78魏顺平 . 在线学习行为特点及其影响因素分析研究 OER2012, 18( 4)从浏览资源数的情况来看 , 最大浏览资源数是 96 个 , 说明有的学生浏览了所有资源 。人均浏览资源数为 68 个 , 并且 “68 个 ”也是所有学生浏览资源数中出现次数最多的 , 结合前面对模块有效资源数的统计 , 这 “68 个 ”对应的资源主要来自 “课程各章节 ”和 “体验区 ”两个模块 , 而这两个模