1、2015 年第 9 期高 教 探 索Higher Education Exploration关键词共词分析法:高等教育研究的新方法郭文斌 方俊明收稿日期 : 2015 05 20作者简介 : 郭文斌 , 陕西师范大学副教授 , 硕士生导师 , 博士 ; 方俊明 , 华东师范大学终身教授 、博士生导师 。( 西安 /710062)摘 要 : 关键词共词分析法是一种较新的科学计量分析方法 , 它主要通过对高频关键词对在同一篇文章中出现的频次进行统计分析 , 生成共被引矩阵 。在此基础上 , 通过统计软件 , 进行聚类分析 、多维尺度分析 、因子分析 、主成分分析 、社会网络分析等高级统计处理 ,
2、绘制出二维或者三维的可视化图形 , 客观系统的展示出所关注资料的直观量化信息 。在我国高等教育研究领域较少有学者对此方法进行论述 , 为了帮助大家更好地了解和掌握此方法 , 本文以 2000 2012 年 教育研究 文献热点知识图谱作为实例 , 详细展示了此方法的使用过程和注意事项 。关键词 : 关键词 ; 共词分析 ; 高等教育研究 ; 知识图谱一 、引言随着研究成果的激增 , 数字化期刊的盛行及互联网使用的便捷化 , 可以通过网上搜索引擎快捷的查询并获得这些成果 。在应对海量数字信息的今天 ,传统文献计量和综述方式 , 不仅耗费时间 、效率低下 、查询资料的时间跨度短 , 而且难以全面搜集
3、海量文献信息 , 造成文献研究偏于定性归纳 、过于主观 。 1激增的数据背后隐藏着许多重要的信息 , 缺乏挖掘数据背后隐藏的知识的手段 , 导致了 “数据爆炸但知识贫乏 ”。 2如何在浩如烟海的数字文献中 ,将这些零散的信息全面 、快速综合起来 , 挖掘出有深度的信息为我所用 , 已经成为众多研究者关注的热点 。随着计算机技术的不断提升 , 以及数理统计方法的完善 , 研究者使用计算机进行数据挖掘 ( Da-ta Mining, DM) 的能力得以大大提升 。在此背景下 , 科学知识图谱开始成为当前国际科学计量学领域热门的方法之一 。它是通过将科学计量学的引文分析方法与可视化技术相结合达到对信
4、息的有效组织和利用 , 生成新的知识 。 3该方法首先 , 通过计算机和互联网搜索引擎强大的自动查询功能 , 在极短的时间里面完成对海量信息的准确查询 。其次 , 通过计算机对已查询到的海量分散信息进行文献计量统计分析 , 不仅可以通过量化模型将其以科学的 、可视化的形式直观的呈现出来 , 而且还可以发现它们之间的深层次关系和趋势 , 对将要进行的同领域的研究提供科学的指导 。该方法被国内外的许多科学计量学研究者应用于学科前沿的研究 。但是 , 国内教育研究方法方面还比较落后 。许多现代科学研究方法在教育科研中应用得很少 , 现代数学迟迟未被引进到教育科学中来 。 4对于科学计量方法在教育研究
5、中应用的专题介绍性文献并不多见 。我们在撰写本文前 , 使用关键词共词分析方法分别对国内特殊教育和自闭症 ( 孤独症 ) 5相关研究成果进行了梳理和总结 , 积累了一定的经验 , 同时 , 该方法对大量文献综合处理的高效性 、准确性 、客观性和直观性给我们留下了深刻的印象 。为了帮助国内的高等教育研究者能够对这种方法有所了解 , 并且能够在今后的研究中更多的使用这种方法 , 提升自己教育科研的准确性和科学性 , 下面 , 我们以代表国内教育最高研究水准的教育类的核心期刊 教育研究 在 2000 2012 年发表的所有文献作为研究资料 , 向大家展示该方法的具体使用过程和注意事项 。二 、关键词
6、共词分析方法( 一 ) 关键词共词分析方法简介51理论探讨 关键词共词分析法 : 高等教育研究的新方法共词分析 ( Co word Analysis) 是一种较新的文献计量学方法 , 其属于内容分析方法的一种 。其主要原理是对一组词两两统计它们在同一篇文献中出现的次数 , 以此为基础对这些词进行聚类分析 ,从而反映出这些词之间的亲疏关系 , 进而分析这些词所代表的学科或主题的结构与变化 。 6共词分析法可分别以文献的主题词和关键词进行共词分析 , 但我们倾向于主张采用关键词进行共词分析来得出结论 , 主要原因有 : 第一 , 关键词是论文中起关键作用的 、最能说明问题的 、代表论文内容特征的
7、、或最有意义的词 7; 第二 , 关键词不仅准确地反映论文的主题 , 而且其本身应具有独立的检索功能 ; 第三 , 由于一篇文献的关键词或主题词是文章核心内容的浓缩和提炼 , 因此 , 如果某一关键词或主题词在其所在的领域的文献中反复出现 , 则可反映出该关键词或主题词所表征的研究主题是该领域的研究热点 8; 第四 , 通过对高频关键词共现关系分析 ,可以进一步明晰若干热点研究领域 。 9关键词共词分析主要是通过共词分析软件 , 对符合条件的查询到的海量信息的关键词对在同一篇文章中出现的频次进行统计分析 ( 共词分析 ) , 生成共被引矩阵 。在此基础上 , 利用统计软件 , 进行聚类分析 、
8、多维尺度分析 、因子分析 、主成分分析 、社会网络分析等高级统计处理 , 绘制出二维或者三维的可视化图形 ,客观系统的展示出所关注资料的直观量化信息 。( 二 ) 关键词共词分析方法的具体操作过程1 准备研究工具下载并安装 Bicomb 共词分析软件和 SPSS20 作为主要研究工具 。Bicomb 共词分析软件由中国医科大学医学信息学系崔雷教授和沈阳市弘盛计算机技术有限公司开发 。下载获取地址为崔雷教授科学网的 博 客 网 址 : https: / /skydrive live com/? cid =3adcb3b569c0a509id =3ADCB3B569C0A509%211195。2
9、准备研究资料首先 , 进入网络搜索引擎 , 根据自己研究目的限定文献来源 , 进行文献检索 。根据自己研究需要和目的对文献进行取舍和保留 。再次 , 对选取的文献按照统一格式进行保存 。第三 , 对保存的文献进行标准化 。最后 , 将保留文献的格式转化为 Bicomb共词分析软件能够识别的 ANSI 编码 , 供后续量化统计分析使用 。这里值得注意的是 , 如果不将文本格式编码转为 ANSI 编码 , Bicomb 共词分析软件将无法识别有效信息 。3 进行量化统计分析首先 , 使用 Bicomb 软件进行关键词统计并确定提取 、导出高频关键词词篇矩阵 。有关 Bicomb 软件进行关键词统计
10、的详细操作过程请阅读相关操作手册 。 10其次 , 采用 SPSS20 对高频关键词进行聚类分析并生成 Ochiai 系数相同矩阵 。再次 , 采用 SPSS 将高频关键词的相同矩阵转化为相异矩阵并进行多维尺度分析 。最后 , 对上述量化结果进行定量和定性结合的分析 , 得出相应的结论和建议 。概括而言 , 关键词共词分析法的一般过程包括 :明确研究的问题 、选定并标准化研究材料 、高频关键词的选定 、共现矩阵的提取 、进行高级统计处理( 相同矩阵 、相异矩阵的转化 、聚类分析 、多维尺度分析 ) 。三 、关键词共词分析方法示例为了更好的使大家掌握该方法 , 下面 , 我们以“2000 201
11、2 年 教育研究 文献热点知识图谱 ”为例向大家进行详细的示范说明 。( 一 ) 查找准备文献首先 , 进入中国学术文献网络出版总库 , 进入标准检索对话框 , 将发表时间栏的具体日期定义为从 “2000 01 01”到 “2012 12 31”, 文献出版来源限定为 “教育研究 ”。根据限定好的条件进行文献检索 , 检索到文献 2908 条 。其次 , 根据研究需要删除研讨会综述 、课题介绍 、会议通知 、卷首语 、会议记录 、课题通过鉴定 、读后感 、简介 、研讨会简介 、书评 、成果鉴定会 、学院以及学校简介信息 、人物专访 、投稿须知 、会议纪要 、出版信息 、目录信息 、公告等 ,
12、得到有效论文 2550 篇 。再次 , 对上述文献统一按照题名 、作者 、关键词 、单位 、摘要 、年 、期等信息以文本形式保存 。最后将保存的文本信息编码格式统一改为 ANSI 编码后保存 。( 二 ) 进行量化统计1 进行关键词词频统计分析并提取高频关键词频次一个学术研究领域较长时域内的大量学术研究成果的关键词集合 , 可以揭示研究成果的总体内容特征 、研究内容之间的内在联系 、学术研究发展的脉络与发展方向等 。 11如果在统计文献时 , 关键词出现的频次越高 , 则表示与该关键词有关的研究成果越多 , 研究内容的集中性就越强 。一个研究领域61理论探讨 关键词共词分析法 : 高等教育研究
13、的新方法的少量高频次的关键词 , 拥有该学科明显大的信息密度与知识密度 , 成为信息与知识需求者检索文献的重点 , 它们被称为核心关键词 。 12词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法 。 13对 2550 篇文章中的 15976 个关键词进行词频统计分析 , 发现关键词出现的频次范围是 1 107。为了减轻工作量 , 对关键词频次大于 20 的高频关键词进行提取 , 结果见表 1。表 1 频次大于 20 的高频关键词表序号 关键词 频次 序号 关键词 频次 序号 关键词 频次1 高等教育 107
14、 19教师专业发展35 37高等职业教育262 基础教育 69 20 均衡发展 35 38 教学活动 263 教育公平 63 21 教育资源 33 39 生活世界 264 教育改革 59 22 素质教育 33 40 课堂教学 255 教师 59 23 中小学教师 32 41 师生关系 256 教育研究 54 24 价值取向 31 42 教育 247 课程改革 52 25 教育科研 31 43 学生 248 教师教育 52 26 以人为本 31 44 教育思想 239 教育发展 48 27 农村教育 31 45 课程 2310 教育理论 44 28 教学过程 29 46 教学论 2211 教育实
15、践 44 29 教育政策 29 47农村义务教育2212 学校教育 44 30 教学改革 29 48科学发展观2113 道德教育 40 31 教学模式 29 49理论与实践2114 高等学校 39 32 教育理念 29 50 发展 2115 职业教育 38 33 学习者 28 51 民办教育 2116 教育质量 37 34 大学 27 52基础教育课程改革2017 义务教育 37 35 学科建设 27 合计 183918 教育学 36 36 大学生 26从表 1 可以看出 , 频次大于等于 20 的有 52 个关键词 , 占关键词总数的 325%, 其出现的频次合计为1839 次 , 词均 3
16、5 37 次 , 占关键词总频次 ( 15976)的 1151%。这些高频关键词表述的研究内容 , 是2000 2012 年 教育研究 发表文章的核心内容 。从高频关键词分布顺序可看出 , 教育研究 涉及的前10 个研究热点依次为 : 高等教育 ( 107) 、基础教育( 69) 、教 育 公 平 ( 63) 、教 育 改 革 ( 59) 、教 师( 59) 、教育研究 ( 54) 、课程改革 ( 52) 、教师教育( 52) 、教育发展 ( 48) 、教育理论 ( 44) 。这一统计结果 , 与 2000 2009 年八种教育学期刊文献前 10 位高频关键词 ( 高等教育 、课程改革 、教育
17、研究 、教育改革 、素质教育 、教学改革 、基础教育 、课堂教学 、教师 、教育理论 ) 对比 , 有 7 个高频关键词完全重合 , 排在第一位的高等教育和最后一位的教育理论在排序上完全吻合 , 其它 5 个仅在排列顺序上发生差异 。这一结果不仅验证了本研究中统计方法的可信 ,而且还进一步说明相对于其它教育研究刊物 , 教育研究 起着风向标的作用 。为深入挖掘这 52 个高频关键词的词频之间的关系以及它们背后隐藏的有效信息 , 还需要进一步采用关键词共现技术来进行深入的计量学研究 。2 生成高频关键词的相同和相异矩阵首先 , 生成高频关键词词篇矩阵 。对各个高频关键词是否在其它论文中成对出现
18、( 出现为 1, 否则为 0) , 利用 Bicomb 软件生成高频关键词词篇矩阵 。词篇矩阵考察各高频关键词间的亲疏关系 , 词篇矩阵表示的是两目标之间的相似程度的矩阵 , 即两者数字越大表明两者关系越近 , 越小表明两者关系越远 。 14其次 , 生成高频关键词相似系数矩阵 。以关键词词篇矩阵为基础 , 在 SPSS20 中进行相关分析 , 数据类型选择 “binary”二元变量 , 相似系数选择 “Ochiai”系数 , 构造出高频关键词相似系数矩阵 。 15相似矩阵中的数字表明数据间的相似性 ,数字的大小表明了相应的两个关键词之间的距离远近 , 其数值越接近 1, 表明关键词之间的距离
19、越近 、相似度越大 ; 反之 , 数值越接近 0, 则表明关键词之间的距离越大 、相似度越小 。最后 , 生成高频关键词相异系数矩阵 。为了消除由于关键词共现次数差异所带来的影响 , 根据相似系数矩阵 , 采用相异系数矩阵 =1 相似系数矩阵 , 产生相异系数矩阵 。相异系数矩阵中数字表明数据间的相异性 , 其含义与相似系数矩阵意义相反 , 数值越接近 1, 表明关键词之间的距离越大 。相异系数矩阵结果见表 2。表 2 高频关键词 Ochiai 系数相异矩阵 ( 部分 )高等教育基础教育教育公平教育改革教师教育研究课程改革教师教育高等教育0000 0988 0963 0975 1000 100
20、0 1000 1000基础教育0988 0000 0939 0953 0985 1000 0816 0967教育公平0963 0939 0000 0918 0984 0949 0983 100071理论探讨 关键词共词分析法 : 高等教育研究的新方法( 续表 2)高等教育基础教育教育公平教育改革教师教育研究课程改革教师教育教育改革0975 0953 0918 0000 0983 0894 0964 0946教师 1000 0984 0984 0983 0000 1000 0910 0982教育研究1000 1000 0949 0894 1000 0000 0981 0981课程改革1000 0
21、816 0983 0964 0910 0981 0000 0962教师教育1000 0966 1000 0946 0982 0981 0962 0000从表 2 可以看出 , 各关键词分别与高等教育距离由远及近的顺序依次为 : 教师 ( 1 000) 、教育研究 ( 1 000) 、课程改革 ( 1 000) 、教师教育 ( 1000) 、基础教育 ( 0 988) 、教育改革 ( 0 908) 、教育公平 ( 0963) 。这个结果说明 , 研究者在论及高等教育时 , 会更多的将其与教师 、教育研究 、课程改革与教师教育结合在一起讨论 , 而较少和基础教育 、教育改革 、教育公平结合起来 。
22、采用上述原理 ,综合表 2 中的关键词相异系数矩阵数据 , 可以初步得出的结论为 : 2000 2012 年在 教育研究 发表的成果中 , 涉及到基础教育与课程改革的资料较少 ,大量研究主要以高等教育为探讨对象 , 关注高等教育中涉及的教师 、教育研究 、课程改革及教师教育等主要因素 , 对这些因素予以了更多的关注 。出现这一结果的原因 , 一方面是 教育研究 从 2004年开始增大了对 “教师 ”这一关键词的关注 , 开辟了专栏 。另一方面的原因是 , 2001 年 “教师教育 ”被国务院首次提出后 , 引起了多方面尤其是教育界对此问题的高度重视 。3 进行高频关键词聚类分析聚类分析是选定一
23、些分类标准 , 将不同的观察体加以分类 , 同一类 ( 集群 ) 之内观察体彼此的相似度愈高愈好 , 而不同一类之间观察体彼此的相异度愈高愈好 。 16高频关键词聚类分析是通过高级统计对已经发表文献的高频关键词组的相似性与相异性分析 , 来发现它们之间的远近关系 , 挖掘隐藏在它们背后的研究者关心的知识信息 。关键词聚类分析时 , 先以最有影响的关键词 ( 种子关键词 ) 生成聚类 ; 再次 , 由聚类中的种子关键词及相邻的关键词再组成一个新的聚类 。关键词越相似它们的距离越近 , 反之 , 则越远 。将上述 52 个高频关键词构成的 52 52 的相似系数矩阵 , 导入 SPSS20 进行聚
24、类分析 。结果见图 1。图 1 2000 2012 年 教育研究 高频关键词聚类树状图从图 1 可以直观的看出 2000 2012 年 教育研究 高频关键词被分为 8 个种类 , 它们的具体分布结果见表 3。从表 3 可以看出 , 2000 2012 年 教育研究 8 类研究具体分布为 :种类 1 为教学过程中的活动和改革 , 包括 14 个关键词 , 其可以细分为 6 小类 : 小类 1 基础教育教学活动及过程 , 包括 3 个关键词 ( 教学过程 、教学活动 、基础教育课程 ) ; 小类 2 教学改革与教学论 ,包括 2 个关键词 ( 教学改革 、教学论 ) ; 小类 3 教学模式与课堂教
25、学 , 包括 2 个关键词 ( 教学模式 、课81理论探讨 关键词共词分析法 : 高等教育研究的新方法堂教学 ) ; 小类 4 学生 、教师及其发展 , 包括 3 个关键词 ( 学生 、发展 、教师 ) ; 小类 5 师生关系 , 包括 1 个关键词 ( 师生关系 ) ; 小类 6 基础教育及素质教育的课程改革 , 包括 3 个关键词 ( 基础教育 、课程改革 、素质教育 ) 。种类 2 为道德教育与生活 , 包括 2 个关键词( 道德教育 、生活世界 ) 。种类 3 为教育与课程 , 包括 2 个关键词 ( 教育 、课程 ) 。种类 4 为学校教育 、义务教育及教育政策 、观念 ,包括 16
26、 个关键词 , 其可以细分为 7 小类 : 小类 1 学校教育与职业教育 , 包括 2 个关键词 ( 学校教育 、职业教育 ) ; 小类 2 农村教育和农村义务教育 , 包括 2 个关键词 ( 农村教育 、农村义务教育 ) ; 小类 3 义务教育和均衡发展 , 包括 2 个关键词 ( 义务教育 、均衡发展 ) ;小类 4 教育公平 、质量及政策 , 包括 3 个关键词 ( 教育公平 、教育质量 、教育政策 ) ; 小类 5 教育资源 , 包括 1 个关键词 ( 教育资源 ) ; 小类 6 教育发展与教育科研 , 包括 2 个关键词 ( 教育发展 、教育科研 ) ; 小类 7教育理念及对学习者的
27、关注 , 包括 4 个关键词 ( 以人为本 、科学发展观 、教育理念 、学习者 ) 。种类 5 为大学及学科建设 , 包括 2 个关键词( 大学 、学科建设 ) 。种类 6 为教师教育 、教育理论与教育思想 , 包括10 个关键词 , 其可以细分为 3 小类 : 小类 1 教师教育及其专业发展 , 包括 3 个关键词 ( 教师教育 、教师专业发展 、中小学教师 ) ; 小类 2 教学理论 、研究及实践与改革 , 包括 6 个关键词 ( 教育理论 、理论与实践 、教育研究 、教育实践 、教育学 、教育改革 ) ;小类 3 教育思想 , 包括 1 个关键词 ( 教育思想 ) 。种类 7 为高等职业
28、教育和民办教育 , 包括 2 个关键词 ( 高等职业教育 、民办教育 ) 。种类 8 为高等教育 、高等学校与价值取向 , 包括 4 个关键词 , 可以细分为 2 小类 : 小类 1 高等教育与大学生价值取向 , 包括 3 个关键词 ( 高等教育、大学生 、价值取向 ) ; 小类 2 高等学校 , 包括 1个关键词 ( 高等学校 ) 。表 3 高频关键词聚类分析结果种类 1小类 1 教学过程 、教学活动 、基础教育课程小类 2 教学改革 、教学论小类 3 教学模式 、课堂教学小类 4 学生 、发展 、教师小类 5 师生关系小类 6 基础教育 、课程改革 、素质教育( 续表 3)种类 2 小类
29、1 道德教育 、生活世界种类 3 小类 1 教育 、课程种类 4小类 1 学校教育 、职业教育小类 2 农村教育 、农村义务教育小类 3 义务教育 、均衡发展小类 4 教育公平 、教育质量 、教育政策小类 5 教育资源小类 6 教育发展 、教育科研小类 7 以人为本 、科学发展观 、教育理念 、学习者种类 5 小类 1 大学 、学科建设种类 6小类 1 教师教育 、教师专业发展 、中小学教师小类 2教育理论 、理论与实践 、教育研究 、教育实践 、教育学 、教育改革小类 3 教育思想种类 7 小类 1 高等职业教育 、民办教育种类 8小类 1 高等教育 、大学生 、价值取向小类 2 高等学校4
30、 进行高频关键词的多维尺度分析多维尺度分析 ( MDS) 是一种可以帮助研究者找出隐藏在观察资料内的深层结构的统计方法 , 其目的是在发掘一组资料背后之隐藏结构 , 希望用主要元素所构成的构面图来表达出资料所隐藏的内涵 ,尤其是在观察资料体很多时 , 利用多维尺度法更能适切地找出资料的代表方式 。 16采用多维尺度分析时 , 要汇报其 Stress 和 SQ 值 , 它们分别为多维尺度分析中的信度和效度估计值 。其中 , 压力系数( Stress) 是拟合度量值 , 用于维度数的选择 , Stress越小 , 表明分析结果与观察数据拟合越好 , 其值越小 , 说明模型的适合度越高 。Krusk
31、al ( 1964) 给出了一种根据经验来评价 Stress 优劣的尺度 : 若 Stress20%, 则近似程度为差 ( Bad) ; 10%, 为满意( Fair) ; 5%, 则为好 ( Good) ; 2 5%, 为很好( Excellent) ; 其理想的状况为 Stress = 0, 称为完全匹配 ( Prefect) 。 17模型距离解释的百分比 ( SQ) ,表示变异数能被其相对应的距离解释的比例 , 也就是回归分析中回归分析变异量所占的比率 , SQ 值越大 , 即越接近 1, 代表所得到的构形上各点之距离与实际输入之距离越适合 。一般认为 , SQ 在060以上是可接受的
32、。 18采用 spss20 对上述 52 个高频关键词构成的 5252 的聚类分析产生的矩阵进行多维尺度分析 , 标准化方法选择 Z 分数 。结果显示 , Stress = 0120,SQ = 0 823, 说明其拟合效果较好 , 可以反映出91理论探讨 关键词共词分析法 : 高等教育研究的新方法教育研究 高频关键词间的学术联系状况 。多维尺度分析结果见图 2。图 2 2000 2012 年 教育研究 热点知识图谱多维尺度绘制出的坐标称为战略坐标 , 它以向心度和密度为参数绘制成二维坐标 , 可以概括地表现一个领域或亚领域的结构 。 19战略坐标中 , 各个小圆圈代表各个高频关键词所处的位置
33、, 图中圆圈间距离越近 , 表明它们之间的关系越紧密 ; 反之 ,则关系越疏远 。影响力最大的关键词 , 其所表示的圆圈距离战略坐标的中心点越近 。坐标横轴为向心度 ( Centrality) , 表示领域间相互影响的强度 ; 纵轴为密度 ( Density) , 表示某一领域内部联系强度 。 20在战略坐标划分的四个象限中 , 一般而言 , 第一象限的主题领域内部联系紧密并处于研究网络的中心地位 。第二象限的主题领域结构比较松散 。这些领域的工作有进一步发展的空间 , 在整个研究网络中具有较大的潜在重要性 。第三象限的主题领域内部链接紧密 , 题目明确 , 并且有研究机构在对其进行正规的研究
34、 , 但是在整个研究网络中处于边缘 。第四象限的主题领域在整体工作研究中处于边缘地位 ,重要性较小 。 21结合上述理论 , 从图 2 可以看出 , 首先 , 20002012 年 教育研究 热点知识图谱分为 8 个区域 , 虽然种类 1、4 和 6 所占的区域较大 , 种类 2、3、5、7、8 所占区域较小 , 但从其分布位置可以看出 , 这些小的区域处于战略坐标的核心附近 , 表明这些区域是其关注的重点 。种类 7 和种类 8 所处的领域距离战略坐标轴心位置最近 , 表明近几年高等职业教育和民办教育 、高等教育 、高等学校与价值取向成为了 教育研究 发文的热点领域 。其次 ,从各个种类所处
35、战略坐标的象限分布特点来看 , 种类 4 的大部分关键词位于战略坐标的第一象限 , 说明其不仅是 教育研究 杂志组稿的核心领域 , 而且其文章数量相对于其它 7 个种类所占领域更为多 ,也更成熟 , 该领域的研究是我国教育研究的中心领域 。种类 1、8 主要位于第二象限 , 说明其主题相对松散 , 对其关注度还有待于进一步加强 , 其今后在教育研究 文献成果质量提升方面还具有较大的潜在价值 。种类 2、3、6 主要位于第三象限 , 说明这 3 个种类所占的领域内部链接紧密 , 题目明确 ,并且有研究机构正在对其展开正规的研究 , 但在整个研究网络中仍处于边缘 。种类 6 大部分位于战略坐标的第
36、四象限 , 说明它们所处的主题在整个研究中处于边缘地位 , 重要性较小 。种类 7 不仅横跨四个象限 ,而且紧紧围绕在战略坐标轴心 , 说明它所占的领域是教育研究 发文的重点核心领域 , 该领域的研究不仅与国家中长期教育改革和发展规划纲要 ( 2010 2012 年 ) 提出的大力发展职业教育和大力支持民办教育的内容相一致 , 而且还与 教育研究 “2006 中国教育研究前沿与热点问题年度报告 ”中 “创新高等教育发展思路 ”、“拓展高等教育办学多样化 ”、“职业教育的转型与发展取向 ” 22等内容相一致 。此研究结果也被潘黎 、王素的研究所验证 。四 、总结和展望通过上述实例 , 大家可以更
37、直观的感受到关键词共词分析方法的使用效果 , 但是 , 在使用的具体过程中 , 还应该值得关注和思考下述问题 。( 一 ) 进行关键词共词分析前要确保对其进行标准化我们主要针对 教育研究 进行计量分析 , 因为其风格基本一致 , 所以在标准化处理关键词方面比较容易处理 , 但是 , 如果涉及到多个杂志间的文献关键词处理 , 就要特别注意对查询到的文献的关键词进行规范和统一 。比如 , 我们在进行自闭症热点研究时 , 要将在不同刊物中表达同样含义的关键词 “自闭症 ”与 “孤独症 ”统一为 “自闭症 ”。迟景明和吴琳在研究中 , 将 “高职院校 ”、“职业技术学院 ”和 “职技高校 ”标准化为
38、“高职院校 ”, 将“高等学校 ”、“高等院校 ”、“高校 ”、“大学 ”等标准化为 “高校 ”。对关键词的标准化处理 , 能确保最后量化材料的准确 , 进而保证最后科学计量的精确 、科学 。但很多进行科学计量的研究忽视了此问题 , 导致了其研究结果的科学和准确性大打折扣 。( 二 ) 可以尝试使用社会网络分析法更清晰地展示关键词间的强弱关系本研究采用的多维尺度虽然可以较好的观察到变量间的关系 , 但是无法表现他们之间的强弱 。要02理论探讨 关键词共词分析法 : 高等教育研究的新方法更好的表达各个关键词之间的强弱关系 , 大家以后可以尝试进行社会网络分析 。社会网络分析 ( SocialNe
39、twork Analysis) ( 简称 SNA, 有的文献称为 “社会网 ”或 “网络分析 ”) 是包括测量与调查社会系统中各部分 ( “点 ”) 的特征与相互之间的关系( “连接 ”) , 将其用网络的形式表示出来 , 然后分析其关系的模式与特征这一全过程的一套理论 、方法和技术 。 23采用社会网络分析得出的三位立体网络图 , 更能直观地反应各个体 ( 节点 ) 的位置及它们之间的相互关系 ( 线段 ) 。在原始图线条密集 , 不易分析时 , 还可进行凝聚子群分析 , 使图的直观性增强 , 更容易分析理解 。 24社会网络分析方法介绍及其软件的下载 , 国际社会网络分析网 ( http:
40、 / /www insna org/cgi bin/softdatasearch cgi) 中给出了 Construct、Network Genie、OGAN 1Social Net-work Analysis、PATNE、PermNet、Socilyzer、UCINET software for Social Network Analysis 八种社会网络分析软件 。中文社会学网 ( http: / /www sociolo-gy2010 cass cn/news/133424 htm) 给出了包括上述软件在内的 20 种软件介绍和链接地址 , 感兴趣的读者可以自己尝试使用 。( 三 ) 关
41、键词共词分析法和定性方法结合使用才能更好解读研究结果虽然热点知识图谱是采用科学计量法绘制出来的 , 但是该方法的使用并非完全依赖定量技术 , 其还依赖于定性分析技术 。在进行了聚类分析和多维尺度分析之后 , 对于各个种类及其所在区域的划分和命名均需要雄厚的专业功底 。它就像采用因子分析之后 , 对于各个因子的命名需要结合专业知识来命名一样 。因此 , 要进行科学知识图谱的绘制 , 需要将定量研究与定性分析结合起来 , 具有一定的专业背景 , 才能够对计量结果进行准确 、客观的解读 。( 四 ) 进行关键词共词分析方法时软件的选取也至关重要虽然现在国内很多研究者 , 在社会学科 、管理学科 、医
42、学等研究领域对中文文献的热点知识图谱的绘制采用了陈朝美博士研发的 CiteSpace 软件 , 但是该软件的优势在于处理外文 , 尤其是英文文献上 ,对于中文献的处理还存在一定的不足 , 而我们所介绍的 Bicomb 软件在中文文献的共词分析方面较有优势 , 因此 , 我们建议大家对中文材料进行科学计量研究时更多的采用此软件 。通过本文的介绍 , 我们衷心希望能够帮助高等教育研究者对关键词共词分析法有所了解 , 同时 ,也真诚的希望越来越多的高等教育研究者投入到教育研究成果的科学计量研究中来 !参考文献 : 1 潘黎 , 王素 近十年来教育研究的热点领域和前沿主题 基于八种教育学期刊 2000
43、 2009 年刊载文献关键词共现知识图谱的计量分析 J 教育研究 , 2011( 2) : 47 53 2 王方华 , 陈洁 , 编著 数据库营销 M 上海 :上海交通大学出版社 , 2006 3 郭文斌 , 方俊明 , 陈秋珠 基于关键词共词分析的我国自闭症热点研究 J 西北师大学报 ( 社会科学版 ) , 2012, 49( 1) : 128 132 4 郑日昌 , 崔丽霞 二十年来我国教育研究方法的回顾与反思 J 教育研究 , 2001( 6) : 17 2 5 郭文斌 , 陈秋珠 特殊教育研究热点知识图谱 J 华东师范大学学报 ( 教育科学版 ) , 2012, 30( 3) : 49
44、 54 6 崔雷 专题文献高频主题词的共词聚类分析 J 情报理论与实践 , 1996, 19( 4) : 49 51 7 马妍春 , 黄可心 科技论文摘要 、关键词及参考文献的规范化 J 情报科学 , 1999, 17( 6) : 625 627 8 杨国立 , 李品 , 刘竞 科学知识图谱 科学计量学的新领域 J 科普研究 , 2010, 5( 4) : 28 34 9 王凡 科学知识图谱视域中的 图书馆理论与实践 J 图书馆理论与实践 , 2011,( 8) : 23 26 10 崔雷 书目共现分析系统 用户使用说明书 Z/OL http: / /cid 3adcb3b569c0a509
45、skydrive livecom/browse aspx/BICOMB2012 04 13 11 李文兰 , 杨祖国 中国情报学期刊论文关键词词频分析 J 情报科学 , 2005, 23( 1) : 68 70 12 安秀芬 , 黄晓鹂 , 张霞 , 等 期刊工作文献计量学学术论文的关键词分析 J 中国科技期刊研究 ,2002, 13( 6) : 505 506 13 马费城 , 张勤 国内外知识管理研究热点 基于词频的统计分析 J 情报学报 , 2006, 25( 2) : 163 170 14 邱均平 , 马瑞敏 , 李晔君 关于共被引分析方法的再认识和再思考 J 情报学报 , 2008,
46、 27( 1) :69 74( 下转第 26 页 )12教育管理 协同创新中心激励机制构建研究单位的违约责任或付之阙如 、或语焉不详 。为保障中心负责人的正当权益 , 激发其工作热情 , 必须将协同单位的各种承诺在相关契约中予以明确 , 并对协同单位的责任和义务以及中心负责人可利用的救济措施做出具体约定 , 促使协同单位与中心负责人建立平等关系 。五 、结语无论是对中心负责人的激励约束 , 还是对协同单位机会主义倾向的抑制 , 均需将相关措施制度化 、规范化 , 才能使之持久发挥作用 。本文基于委托 代理论开展协同创新中心激励机制构建研究 , 目的并不在于寻找实现个别协同单位利益最大化的具体手
47、段 , 而是希望有助于推动协同单位与实际管理者实现激励相容 , 以提高协同创新中心的整体建设效益 。参考文献 : 1 中华人民共和国高等教育法 EB/OL ht-tp: / /www npc gov cn/wxzl/gongbao/2000 12/05/content_5004712 htm 2 孙天华 大学治理结构中的委托 代理问题 : 当前中国公立大学委托代理关系若干特点分析 J 北京大学教育评论 , 2004( 4) : 30 3 高键 , 程明 论激励约束机制与公司治理结构 J 山西财经大学学报 , 2002( S2) : 39 4 龚怡祖 现代大学治理结构 : 真实命题及中国语境 J
48、 公共管理学报 , 2008( 4) : 74 5 申来津 信仰激励的发生机制及其权变分析 J 人文杂志 , 2003( 1) : 143 6 吴晓立 信息不对称条件下的企业激励机制设计 J 经营与管理 , 2009( 7) : 56 7 张亦工 交易费用 、财产权力与制度变迁 新制度经济学理论体系透视 J 东岳论丛 ,2000( 5) : 35 8 明航 委托 代理理论在民办学校治理中的应用 J 辽宁教育研究 , 2008( 2) : 79 9 钟力平 斯金纳的强化理论及其应用 J 企业改革与管理 , 2008( 2) : 70( 责任编辑 刘第红 )( 上接第 21 页 ) 15 迟景明 , 吴琳 近十年我国高等教育学学科研究热点和趋势 基于研究生学位论文的共词聚类分析 J 中国高