收藏 分享(赏)

我国内科学知识图谱分析.doc

上传人:hskm5268 文档编号:7823229 上传时间:2019-05-27 格式:DOC 页数:37 大小:2.40MB
下载 相关 举报
我国内科学知识图谱分析.doc_第1页
第1页 / 共37页
我国内科学知识图谱分析.doc_第2页
第2页 / 共37页
我国内科学知识图谱分析.doc_第3页
第3页 / 共37页
我国内科学知识图谱分析.doc_第4页
第4页 / 共37页
我国内科学知识图谱分析.doc_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、 南京中医药大学经贸管理学院本科生毕业论文论 文 题 目 我国内科学知识图谱分析 作 者 姓 名 张琼 学 号 012109240 专业、年级 09 信管 2 班 申 请 学 位 管理学学士 指 导 教 师 谢靖 2013 年 5 月 17 日II学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,遵守严肃求实的科学精神,独立进行研究所取得的成果。论文中除已注明引用和致谢的内容外,不包含其他个人或者集体已经发表或撰写过的研究成果。本人完全意识到本声明的法律结果由本人承担。论文作者签名:张琼日 期:2013.5.17III目 录1 引言 11.1 问题的提出及意义 11.2

2、国内外研究现状 12 知识图谱的方法、工具及数据来源 22.1 知识图谱的绘制方法及常用工具 22.2 数据来源及研究思路 33 内科学 2004-2008 发文及引用基本情况 44 内科学分年度研究热点与知识源流 54.1 内科学分年度研究热点 64.2 内科学分年度知识源流 135 内科学知识图谱综合分析 .205.1 2004-2008 年内科学关键词共现图谱分析 .205.2 2004-2008 年 XX 学(XX 学校)文献共被引图谱分析 225.3 2004-2008 年 XX 学(XX 学校)作者共被引图谱分析 256 小结 .27参考文献 .28致 谢 30IV表目录表 1 C

3、itespaceII 支持格式 4表 2 内科学核心期刊 2004-2008 发文及引文数据 .4表 3 2004 年中间中心度排名前 15 的关键词表 4 2004 年 15 个热点关键词表 5 2005 年中间中心度排名前 15 的关键词表 6 2005 年 15 个热点关键词表 7 2006 年中间中心度排名前 15 的关键词表 8 2006 年 15 个热点关键词表 9 2007 年中间中心度排名前 15 的关键词表 10 2007 年 15 个热点关键词表 11 2008 年中间中心度排名前 15 的关键词表 12 2008 年 15 个热点关键词表 13 2004 年中介中心度排名

4、前 10 篇引文表 14 2004 年被引频次前 10 篇引文表 15 2005 年被引频次前 10 篇引文表 16 2006 年被引频次前 10 篇引文表 17 2007 年中介中心度排名前 4 篇引文表 18 2008 年被引频次前 10 篇引文表 19 2004-2008 年总出现频次大于 200 的 36 个关键词表 20 2004-2008 年总出现频次排名前 30 篇引文表 21 2004-2008 年被引频次排名前 30 位高影响学者V图目录图 1 研究思路 .3图 2 2004 年关键词共现图谱 3图 3 2005 年关键词共现图谱图 4 2006 年关键词共现图谱图 5 20

5、07 年关键词共现图谱图 6 2008 年关键词共现图谱图 7 2004 年文献共被引图谱图 8 2005 年文献共被引图谱图 9 2006 年文献共被引图谱图 10 2007 年文献共被引图谱图 11 2008 年文献共被引图谱图 12 2004-2008 年关键词共现图谱聚类视图图 13 2004-2008 年关键词共现图谱 Timeline 视图图 14 2004-2008 年文献共被引图谱聚类视图图 15 2004-2008 年文献共被引图谱 Timeline 视图图 16 2004-2008 年作者共被引图谱聚类视图摘 要: 本文以北京大学中文核心期刊要目总览 (2008 版)所收录

6、的引文数据为基础,绘制了内科学学科的知识图谱。通过对学科关键词共引、知识源流等的分析,揭示出本学科的发展进程及其趋势。关键词: 知识图谱;关键词共引;知识源流Abstract:This paper draws the knowledge map of the Internal Medicine subject based on the citation data recorded by the Chinese core journals(version of 2008) of Peking University .It shows the development process and tre

7、nds of the subject by analyzing the keywords co-citation of the subject and the origins of the knowledge of the subject.Key words: knowledge map ; keyword co-citation ; origins of the knowledge11 引言1.1 问题的提出及意义文献是人们获取知识的重要媒介,是人类文化发展到一定阶段的产物,并随着人类文明的进步而不断发展。而随着人类文化的发展,文明的进步,每年发表的文献数量以爆炸式增长,要想从浩如烟海的文献

8、中获取想要的知识,分析当前的研究前沿热点问题,把握一个领域发展的网络就必须要借助于科学计量学、可视化技术等。知识图谱已经成为当今计量学领域学术研究群体共同关注的前沿课题,目前被广泛应用于自然科学与人文科学领域。以往的可视化技术由于存在一系列缺点与在可视化技术上的局限性,因而产生了新一代的可视化技术与知识图谱研究。新兴的知识图谱可将某个学科领域或者知识单元间错综复杂的交互关系用节点与链接等现代可视化技术进行处理与展示,使人们可以清晰直观的了解某个学科或者领域发展进程中的知识结构、研究趋势等。运用知识图谱能够有效的从众多文献中获取知识,也是目前人们从茫茫文献中获取所需的可视化的方法。学术期刊作为文

9、献的一种,对其进行深入挖掘有助于把握学科领域研究的全景,有利于科研工作者了解最新学科内研究热点与前沿,促进学科繁荣与发展。本研究通过运用知识图谱的可视化理论方法,以我国关于内科学学科下的核心期刊为对象,借助 CitespaceII 可视化工具分别从关键词、作者、被引文献和被引作者四个角度来系统地构建了我国内科学关键词共现图谱、文献共被引图谱、作者共现图谱和作者共被引图谱,比较全面地形成我国内科学科知识图谱。多角度阐述分析了我国内科学学科的研究热点及其发展趋势,揭示了内科学学科知识源流的演进过程,探索了我国内科学学科的主要分支研究领域及各领域代表学者,并深刻认知了我国内科学学者间科研合作现状。从

10、内科学研究角度出发,多方位勾勒出内科学学科发展脉络,以不断促进我国内科学的健康持续发展,从而带动我国整个医学的全面发展和进步。1.2 国内外研究现状科学知识图谱是在应用数学、计算机科学、信息科学等学科的理论方法与科学计量学引文分析、共现分析、社会网络分析等方法相结合的基础上逐渐发展起来的,并利用可视化的图谱形象地揭示出科学的发展趋势和热点问题。知识图谱的研究发端于美国、荷兰等国家。根据有关文献介绍,国外知识图谱的研究主要有以下几方面:(1)以引文分析理论为基础研究不同学科的知识图谱。如加菲尔德等人(1964 年)手工绘制了 DNA 领域的历时态图谱;普赖斯(1965 年)运用相同的数据完成了他

11、的经典论文科学论文网络;Small H(1973)首次提出了论文共被引的概念和分析方法,并绘制了 SCI 中粒子物理学领域高被引论文的共被引图谱。(2)利用复杂网络理论和方法对引文网络、科研合作网络、关键词共现网络等展开研究。如社会学家 Hummon(1989 年)把社会网络分析方法引入了引文网络研究,提出了引文网络中的关键路径算法;纽曼(20012年)用复杂网络方法测定了生物医药、物理学和计算机科学等领域科学合作网络中最有影响力的科学家,并揭示了科学合作结构具有复杂网络的高集聚和小世界等特性。(3)将计算机科学的理论、方法和引文分析等有机结合,利用专门软件对大量反映知识结构及发展脉络的数据自

12、动处理,生成可视化的知识图谱。如陈超美提出了探索关键路径的 pathfinder算法,并开发了供全球用户免费下载使用的 Citespace 软件,他在 2010 年还提出了多视角的共引分析方法,对知识图谱的发展做出了重要贡献。总体来讲, 国外学者对知识图谱的理论、方法和可视化软件等方面的研究都处于领先地位,而我国对知识图谱的关注则滞后于国外,但是也取得了一些成绩。从 20 世纪 90 年代至今,我国的学者也开始了科学知识图谱的研究。前期的研究并不系统,大多是对绘制方法的探讨。主要的研究成果也有很多,如中国科学院的耿海英毕业论文最后的实证部分,是用共引分析方法等绘制了情报学作者间知识图谱,并和

13、White 的结果进行对照,分析异同。李运景(2009)使用 HistCite 和 SPSS 对国内引文数据库中杂交水稻领域分别绘制了编年图和同被引图谱。此外,涉及到具体构建知识图谱系统的专家有我国社会科学院的李思经老师,他在知识图谱方面研究比较深入,也有了一些成果,他的学生康永兴在 2006 年的毕业论文中构建了学科知识图谱系统,是将知识图谱系统应用于科学的一个探索。大连理工大学科学院与科学技术管理研究所的刘则渊老师是我国知识图谱绘制方面研究的代表人物,该研究所的一系列研究人员是我国系统研究科学知识图谱的领头人。中国科学院国家科学图书馆刚刚建成了一个基于 SCI 和 ESI 数据库绘制各领域

14、科学图谱的系统。对于我国知识图谱的研究发展,显然研究队伍在不断地扩大,从而知识图谱研究领域也取得了显著进步。不过,有关知识图谱本身的系统研究几乎没有。总体来讲,国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,相对于国外,对知识图谱的应用研究还比较薄弱。但是由于知识图谱是科学计量学领域的一个新的活跃分支,其历史还比较短,所以,国内外在知识图谱的应用研究方面,差距并不大。2 知识图谱的方法、工具及数据来源2.1 知识图谱的绘制方法及常用工具知识图谱在学界也可称作知识域可视化,是显示知识的结构关系、演进过程和发展趋势的一系列不同的图形。它的基本原理是分析文

15、献、作者、关键词、期刊等的相似性分析及测量。根据不同的研究视角、方法和技术可以绘制不同类型的知识图谱。知识图谱的绘制方法大体可以分为多元统计分析、引文分析、共引分析、共现分析、词频分析、社会网络分析六种。多元统计分析是一种研究多个变量或者因子之间的相互关系的综合分析方法。在构建知识图谱时大多采用该方法中的因子分析、多维尺度分析和聚类分析三种方法。因子分析3是从表征对象的多个指标变量中综合出几个少数独立的综合因子来对研究对象进行描述的一种方法,进而对数据进行精简,但图示功能较差。多维尺度分析方法利用低维空间中的散列点来表示原高维空间数据间的位置和亲疏关系,但数据点之间没有链接,无法显示关联性。聚

16、类分析法是根据各个对象间的相似度来进行划分类别的一种分析方法。聚类内的对象性质尽可能相似,聚类间的对象尽可能相异。但该方法无法直观的反映出对象间的距离和结构关系。引文分析是运用数学、统计学和逻辑学对期刊、论文和专著等对象的引用与被引用现象进行分析的一种方法。共引分析是分析两篇(或者两篇以上)文献同时被其他文献所引用的研究方法,主要研究文献之间的共引关系。共现分析是定量化各类信息载体中共现信息的方法,主要是探测研究对象间的亲疏关联。词频分析时利用可表征文献主题内容的主题词或者关键词在学科领域出现的频次大小来确定该学科领域的研究热点和发展趋势。社会网络分析方法是对研究对象之间的关系模式进行分析的一

17、种研究方法。对于绘制知识图谱的常用工具目前国内外学者主要使用国外已开发的针对国外数据库格式的可视化工具。主要有 Bibexcel、Thomson Data Analyzer(TDA)、HistCite、VOSviewer、SPSS、Ucinet、Netdraw 和 pajek 等。当然除了这些常用的绘制工具外还有国内的共现挖掘系统 BICOMS,英国的词频分析软件 Wordsmith Tools 等。本文主要选用了集词频分析、引文分析、共现分析、共引分析和社会网络分析于一体的多功能前沿可视化工具 CitespaceII 来对内科医学进行研究。本文从关键词、来源作者、被引文献和被引作者四个角度来

18、研究相关问题。通过对 Citespace 中相关阀值的设置来获取比较好的可视化网络图像,寻找当前内科医学的研究热点与研究进展。2.2 数据来源及研究思路本文以北京大学中文核心期刊要目总览 (2008 版)所收录的内科学科学核心期刊为研究对象,借助中国医药科学引文索引(Chinese Medicine Sciences Citation Index,以下简称 CMSCI)数据库中 2004 年到 2008 年的引文数据作为可视化研究数据来源。格 式 转 化可 视 化数 据 源分 年 度 研 究热 点 图 谱分 年 度 知 识源 流 图 谱抽 取清 洗 、 索 引C M S C IX X 学 可

19、视化 数 据基 本 统 计研 究 热 点共 现 分 析文 献 、 学 者 、 期刊 共 引 分 析图 1 研究思路4数据处理说明:(1)目前 CitespaceII 支持中文处理格式为 CNKI 及 CSSCI 下载格式,本研究数据来源为 CMSCI 数据库,因而要根据软件数据格式进行数据转化;(2)清洗发文及被引数据,由于发文中存在公告、通信,引文中作者标注不规范等情况,需要对发文数据及被引数据进行清洗,并重新建立索引以便进行 CitespaceII 支持格式输出。表 1 CitespaceII 支持格式转换后的数据格式来源作者 AU 张莉来源文献/来源篇名 TI 血清血管内皮细胞生长因子在

20、血管瘤诊断与治疗中的应用期刊图书情报工作 SO 中华小儿外科杂志标引词 DE “血管瘤 “;“血管畸形“;“酶联免疫吸附试验 “;“血管内皮细胞生长因子“机构名称 C1 上海第二医科大学附属第九人民医院整形外科, CHINA.年代 PY 2011参考文献 CR Tan ST, 2000, Plast Reconstr Surg, /Cellular and extracellular markers of hemangioma/Chang J, 1999, Plast Reconstr Surg, /Proliferative hemangiomas:analysis of cytokine

21、gene expression and angiogenesis/Mulliken JB, 1982, Plast Reconstr Surg, /Hemangiomas and vascular malformations in infants and children: A classification based on endothelial characteristics/胡琼华, 2002, 中华整形外科杂志, /血管瘤病人血清中 VEGF 的定量检测及意义/Bielenberg DR, 1999, Int J Oncol, /Progressive growth of infant

22、ile cutaneous hemangiomas is directly correlated with hyperplasia and angiogenesis of adjacent epidermis and inversely correlated with expression of the endogenous angiogenesis inhibitor, IFN-beta/林晓曦, 1998, 中华整形烧伤外科杂志, /增殖细胞核抗原在血管瘤及血管畸形组织中的表达/张莉, 2003, 中华整形外科杂志, /血管瘤和血管畸形的鉴别诊断/此外还需要说明的是:转换时自动删除包含网页

23、形式的引文和没有标明作者或刊名的引文;转换后的参考文献字段顺序为:第一作者、年代、来源、标题。引文作者名中的“, ”被替换为空格;如果引用的是图书,则“来源”字段自动用“N”来代替;如果引文的“年代”字段为空,则自动删除。在转换中,去除了部分不规范发文及引文,因而数据与基于 CMSCI 的医学学科期刊影响力数据略有差异。3 内科学 2004-2008 发文及引用基本情况表 2 内科学核心期刊 2004-2008 发文及引文数据序号 刊名(学科) 2004 2005 2006 2007 20085发文 引文 发文 引文 发文 引文 发文 引文 发文 引文1 肠外与肠内营养 120 1236 12

24、2 1287 116 1360 112 1435 118 13612 中华高血压杂志 126 1380 166 1725 230 2396 222 2340 256 29943世界华人消化杂志 835 21364 769 17628 697 17266 773 19015 811 207774临床心血管病杂志 361 2282 339 2338 297 2398 363 3259 339 32005中国动脉硬化杂志 226 2820 231 3052 301 4070 265 3273 183 27336 中国老年学杂志 706 5135 851 6918 931 7961 1206 1129

25、9 1242 119277中国实用内科杂志 453 1848 559 2576 785 5221 735 5691 450 30058 中国糖尿病杂志 155 1091 187 1237 182 1190 280 1810 271 19899 中国循环杂志 183 1298 181 1249 178 1414 175 1348 173 128210中国心脏起搏与心电生理杂志 174 1334 193 1519 199 1813 201 1900 178 171611 中国内镜杂志 646 3396 579 3621 550 3758 519 3776 327 248612中国地方病学杂志 27

26、5 1822 292 1881 311 2002 285 1831 249 181413 中华传染病杂志 151 1012 150 1092 137 977 245 2009 217 205614中华风湿病学杂志 263 2589 261 3050 246 3152 252 3222 262 347515 中华肝脏病杂志 338 1944 355 2529 319 2621 323 2919 267 271516中华结核和呼吸杂志 319 2633 321 2430 318 2570 318 3015 315 298517中华老年医学杂志 349 2352 334 2475 315 2261

27、308 2568 307 269218中华内分泌代谢杂志 223 1938 238 2343 228 2299 206 2230 247 237119 中华内科杂志 407 2622 429 2600 432 3284 431 3309 379 336020中华消化内镜杂志 249 953 227 1189 245 1520 228 1404 295 203721 中华消化杂志 357 2185 333 2192 390 2629 385 2637 337 276322中华心血管病杂志 449 3118 400 3120 367 3235 307 3336 293 358523 中华血液学杂志

28、 280 1972 260 2085 278 2436 277 2593 282 254724 中华肾脏病杂志 152 1245 259 2027 242 2350 269 2501 280 26694 内科学分年度研究热点与知识源流6本文采集了 CMSCI 数据库中 2004-2008 年间的收录的 40891 篇来源文献,分别从关键词、作者、被引文献和被引作者四个知识单元来绘制图谱。4.1 内科学分年度研究热点1) 2004 年内科学研究热点2004 年共有 4290 个不同的关键词,在 Citespace 中控制阀值的大小使关键词共现图谱中的节点和连接数量在一个合理的范围,并使参考聚类后

29、的 Molularity Q 和 Mean Silhouette 值落在较为合适的范围。经过多次调节阀值大小,最后选取了较为合适的一组阀值。节点类型选为 Keyword,阀值设为(8,1,10) 、 (8,1,10) 、 (8,1,10) ,得到的个体网络中节点数为 258,连接数 222,经过 pathfinder 精简算法简化后自动聚类得到的可视化图像如下:图 2 2004 年关键词共现图谱图 2 中圆环的大小与关键词在文献中出现的频次成正比,圆环外层年轮的宽度与中介中心度的大小成正比。但频次大的节点中介中心度却未必也高,这两个指标分别从统计与网络结构两个角度来诠释节点,没有绝对的关联性。

30、有紫色外圈的节点表示中介中心度大于 0.1 的关键词,上图通过调节聚类标签阀值来控制显示的关键词。聚类标签的阀值依据节点的中介中心度来进行调节,最终得到图中 24 个关键词。为了找出 2004 年内科医学的研究焦点与热点,我们列举了 2004 年中介中心度排名前 15 的焦点关键词(表 3)与出现频次排名前 15 的热点关键词(表 2) 。表 3 2004 年中介中心度排名前 15 的关键词关键词 频次 中介中心度 关键词频次中介中心度 关键词频次中介中心度高胆固醇血症8 0.48 细胞外基质 9 0.44 心肌再灌注 8 0.4信号转导 8 0.47 转化生长因子 11 0.43 糖尿病肾病

31、 27 0.397巨噬细胞 12 0.45 内皮生长因子 9 0.42 超声检查 12 0.39卡维地洛 9 0.45 结缔组织生长因子 9 0.41 心脏缺损 8 0.35糖尿病 65 0.44 超声心动描记术 11 0.4 细胞株 9 0.25表 4 2004 年 15 个热点关键词关键词 频次 中介中心度 关键词 频次 中介中心度 关键词 频次 中介中心度冠状动脉疾病 140 0.01 诊断 80 0.01 肝炎 63 0.00腹腔镜 120 0.00 治疗 79 0.00 癌 62 0.07高血压 111 0.00 糖尿病 65 0.44 心肌梗死 62 0.02老年人 100 0.0

32、0 肝炎病毒 64 0.01 2 型糖尿病 60 0动脉粥样硬化 84 0.00 细胞凋亡 64 0.00胰岛素抵抗59 0.19结合图 2 与表 3、表 4 可以看到高胆固醇血症、信号转导、巨噬细胞、卡维地洛、糖尿病、细胞外基质、转化生长因子 等在图谱中具有较高的中介中心度,位于图谱较为中心的位置,是 2004 年内科医学研究者们共同关注的焦点。而从关键词出现的频次来看(表4) ,得到冠状动脉疾病、腹腔镜、高血压、老年人、动脉粥样硬化、诊断、治疗、糖尿病、肝炎病毒等具有较高的出现频次,是 2004 年众多内科医学工作者的研究热点内容。综合分析图 2、表 3 与表 4 可以看出,根据关键词中介

33、中心度大小与出现频次排名计算出的 2004年前 15 个关键词中可以看到出现频次与中介中心度均较高的为糖尿病,这说明糖尿病为2004 年的重要热点关键词,这一年的糖尿病是内科医学工作者的研究热点与焦点内容。除此之外,我们看出一般中介中心度较大的关键词出现的频次并不是很大,而出现频次很大的关键词中介中心度却很小。出现频次较大的关键词是 2004 年的内科学研究热点内容,而中介中心度较大但出现频次较低的关键词如高胆固醇血症、信号传导、巨噬细胞、卡维地洛等,这些关键词在图谱中具有重要的位置,隐含着未来研究热点的转移。2004 年中出现频次与中介中心度均高的关键词很少,表明这年的研究热点持续时间并不长

34、,而未来将会出现很多新的研究热点。2) 2005 年内科学研究热点2005 年共有 5102 个不同的关键词,节点类型选取 Keyword,阀值设为(10,1,10) 、(10,1,10)和(10,1,10) ,得到的个体网络节点数为 274,连接数为 196。经 pathfinder 精简算法简化自动聚类后得到可视化图像如图 3 所示。图 3 中共有 36 个关键节点,图中的关键词按照中介中心度的大小进行调节显示,结合表 5 可以看出细胞增殖、病理学与病理生理学、心血管疾病、危险因素、信号传导糖尿病肾病、转化生长因子 1 等具有较高的中介中心度,是 2005 年内科学研究关注的焦点问题。为了

35、更好的了解 2005 年内科学的研究状况与热点,我们又列举了这一年出现频次排名前15 的关键词,如表 6 所示。可以看出高血压、糖尿病、腹腔镜、冠状动脉疾病、诊断等具有较高的出现频次,是这一年的研究热点内容。当然对比 2004 年可以知道细胞凋亡、高血压、冠状动脉疾病、动脉粥样硬化、老年人、腹腔镜、诊断、治疗、癌、心肌梗死、肝炎病毒、糖尿病等 12 个关键词仍然是 2005 年内科学的研究热点,不同的是高血压和糖尿病的出现频次相对去年有了很大的提升,而冠状动脉疾病、腹腔镜等的出现频次降低了很多。2005 年内科学的研究热点内容只增加了大鼠、胃癌、病理学与病理生理学三个,很多领域仍然是与 200

36、4 年相同的。不过对比表 5 和表 6 可以看出,2005 年的重点研究内容为病理学与病理生理学、冠状动脉8疾病和动脉粥样硬化,相比 2004 年重点研究热点内容扩展了很多。通过分析图 3、表 5 和表 6 可以将 2005 年的研究热点内容归纳为内科学基础理论研究、内科学各种疾病的研究以及治疗方法的研究。表 5 2005 年中间中心度排名前 15 的关键词关键词 频次 中介中心度 关键词频次中介中心度 关键词频次中介中心度细胞增殖 11 0.4 糖尿病肾病 41 0.3 卡托普利 18 0.21病理学与病理生理学72 0.35 转化生长因子 1 19 0.29 受体 15 0.19心血管疾病

37、 26 0.33 冠状动脉疾病 96 0.25 自身抗体 12 0.19危险因素 43 0.32 氯沙坦 14 0.25 rna 干扰 18 0.16信号转导 12 0.32 血管紧张素 29 0.21动脉粥样硬化89 0.14表 6 2005 年 15 个热点关键词关键词 频次 中介中心度 关键词 频次 中介中心度 关键词 频次中介中心度高血压 174 0动脉粥样硬化89 0.14 胃癌 76 0糖尿病 111 0 细胞凋亡 85 0.04 肝炎病毒 72 0腹腔镜 97 0 老年人 83 0病理学与病理生理学72 0.35冠状动脉疾病 96 0.25 大鼠 80 0.02 癌 72 0诊断

38、 91 0.04 治疗 78 0.06 心肌梗死 71 0.039图 3 2005 年关键词共现图谱3) 2006 年内科学研究热点2006 年共有 5462 个不同的关键词,节点类型选取为 Keyword,阀值设为(11,1,10) 、(11,1,10)和(11,1,10) ,得到的个体网络中节点数为 277,连接数为 184,经过 pathfinder精简算法修剪然后自动聚类得到可视化图谱如下:图 4 2006 年关键词共现图谱图 4 中共有 25 个关键节点,将关键词按中介中心度大小进行排序得到表 7,结合表 7可以看到拥有较高中介中心度的关键节点:基质金属蛋白酶 9、成骨细胞、细胞凋亡

39、、辛伐他汀、人脐静脉内皮细胞、细胞周期和胰岛素抵抗等,它们是 2006 年内科学学者们关注的焦点,为了更好的分析 2006 年内科学的研究热点,我们又按关键词出现频次列出了排名前 15 的关键词,如表 8 所示。表 7 2006 年中间中心度排名前 15 的关键词关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介中心度基质金属蛋白酶-9 13 0.35 细胞周期 17 0.29 细胞系 18 0.24成骨细胞 15 0.3 胰岛素抵抗 83 0.29 糖尿病 88 0.18细胞凋亡 112 0.29 细胞增殖 18 0.27 rna 干扰 34 0.16辛伐他汀 17 0.29 抗药

40、性 16 0.27 脂联素 29 0.15人脐静脉内皮细胞 15 0.29 罗格列酮 28 0.26 瘦素 28 0.14表 8 2006 年 15 个热点关键词10关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介中心度高血压 179 0 腹腔镜 106 0 诊断 92 0动脉粥样硬化 122 0.13 病理学与病理生理学 104 0.07 糖尿病 88 0.18细胞凋亡 112 0.29 冠状动脉疾病 100 0 胰岛素抵抗 79 0.29糖尿病 108 0 治疗 99 0 胃癌 77 0.02心血管病学 106 0.02 老年人 98 0 心肌梗死 77 0.03从表 8 中可

41、以看出 2006 年的研究热点为高血压、动脉粥样硬化、细胞凋亡、糖尿病、心血管病学、腹腔镜和病理学与病理生理学等。与 2005 年相比,高血压仍然处于出现频次最高的位置,说明高血压一直是这两年的研究热点,在高血压中还有些需要攻克的难点。动脉粥样硬化、细胞凋亡、病理学与病理生理学、治疗等研究得到了大大的提升。其中病理学与病理生理学是 2005 年新出现的研究热点,在 2006 年病理学与病理生理学的研究继续提升。而糖尿病的研究相对减少。2006 年的研究热点与 2005 年和 2004 年比较接近,但也出现了两个新的研究内容:心血管病学和胰岛素抵抗。其中胰岛素抵抗为 2004 年的研究热点,20

42、05 年出现了中断,在 2006 年又开始成为了内科学的研究热点。综合分析表 7 和表 8,我们找到中介中心度与出现频次均较高的关键词:细胞凋亡、胰岛素抵抗和糖尿病。说明这三个关键词为 2006 年内科学的重点研究热点,与 2005 年的重点研究热点完全不一样,其中糖尿病与 2004 的重点研究内容相同,说明糖尿病在 2005 年遇到一定的困难后在2006 年得到了很大的发展。结合图 4、表 7 和表 8 我们可以将 2006 年的研究热点归纳为:内科学疾病研究、治疗方法研究与老年人研究。其中对于疾病的研究是 2005 年内科学的研究重点热点内容。而基质金属蛋白酶-9、成骨细胞、辛伐他汀和人脐

43、静脉内皮细胞等出现频次低但中介中心度很高的关键词可能成为以后的研究热点内容。4) 2007 年内科学研究热点2007 年共有 6258 个关键词,节点类型选取为 Keyword,阀值设置为(12,1,10) 、(12,1,10)和(12,1,10) ,得到的个体网络中节点数为 281,连接数为 195。经过 pathfinder精简算法修剪自动聚类后得到可视化图谱如下所示:11图 5 2007 年关键词共现图谱图 5 中共有 16 个紫色外圈的关键节点,我们根据中介中心度的大小列出排名前 15 的重点关键词,结合表 9 可以看出 mtt 法、细胞周期、系膜细胞、结肠癌、逆转录- 聚、糖尿病肾病

44、和急性冠状动脉综合症等具有较高的中介中心度,它们是 2007 年内科学学者们的关注焦点。为了更好的分析 2007 年内科学的研究热点,我们列出了这年出现频次排名前 15的关键词,如表 10 所示。表 9 2007 年中间中心度排名前 15 的关键词关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介中心度mtt 法 14 0.28 糖尿病肾病 58 0.2病理学与病理生理学70 0.16细胞周期 20 0.24急性冠状动脉综合症27 0.18血管平滑肌细胞29 0.16系膜细胞 15 0.24 氧化应激 24 0.18 增值 28 0.16结肠癌 21 0.22基质金属蛋白酶-916

45、0.18 细胞增殖 25 0.16逆转录 -聚 17 0.22 辛伐他汀 14 0.18 心肌梗死 74 0.15表 10 2007 年 15 个热点关键词关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介中心度高血压 189 0 老年人 134 0胰岛素抵抗101 0治疗 145 0.01 细胞凋亡 125 0 心房颤动 91 0.03糖尿病 144 0 冠状动脉疾病 112 0.03 腹腔镜 91 012诊断 143 0 大鼠 111 0 肝炎 85 0动脉粥样硬化 137 0.03 心血管病学 105 0.01 预后 82 0.03由表 10 及与去年的对比可发现,高血压、糖尿

46、病、动脉粥样硬化、细胞凋亡等仍然是内科学的研究热点,同时随着内科学的发展也出现了新的诸如心房颤动、预后等研究热点。不过总体来说内科学的研究热点内容较前几年没有多少改变。每一年新出现的研究热点较少,综合分析表 9 与表 10 可知出现频次与中介中心度均较高的关键词数为 0,说明 2007年的热点研究内容在整个内科学网络中重要性并不是很高。5) 2008 年内科学研究热点2008 年共有 5696 个不同的关键词,节点类型选取 Keyword,阀值设为(11,1,10) 、(11,1,10)与(11,1,10) ,得到的个体网络中节点数为 278,连接数 181,经 pathfinder 精简算法

47、修剪后自动聚类得到可视化图谱如图 6 所示。图 6 中共有 23 个关键节点,根据关键词的中介中心度的大小进行排序,我们列举了排名前 15 的关键词,如表 11 所示。结合图 6 与表 11 可以看到增值、细胞凋亡、凋亡、流式细胞术和 bcl-2 等具有较高的中介中心度,在知识网络中具有重要的地位,是 2008 年内科学学者们关注的焦点。为了更好的分析 2008 年内科学的研究内容与热点,我们列举了出现频次排名前 15 的关键词,如图 12 所示。图 6 2008 年关键词共现图谱表 11 2008 年中间中心度排名前 15 的关键词关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介

48、中心度增值 18 0.3 肝纤维化 68 0.19 细胞周期 18 0.1813细胞凋亡 112 0.21 癌 57 0.19 儿童 30 0.17凋亡 65 0.21 基因 36 0.19 检测 21 0.16流式细胞术 23 0.2转化生长因子118 0.19结缔组织生长因子22 0.15bcl-2 16 0.2 白血病 25 0.18 纤维化 13 0.15表 12 2008 年 15 个热点关键词关键词 频次中介中心度关键词 频次中介中心度关键词 频次中介中心度糖尿病 179 0.03 冠状动脉疾病 109 0.01 心肌梗死 93 0.01高血压 145 0 胰岛素抵抗 105 0.

49、10 大鼠 90 0治疗 126 0.03 动脉粥样硬化 104 0.11 老年 82 0诊断 121 0.03 老年人 100 0病理学与病理生理学72 0.02细胞凋亡 112 0.21 心血管病学 96 0 心房颤动 69 0综合分析表 12 与 2007 年的数据可以看出糖尿病上升为 2008 年的最热门关键词,当然高血压、治疗和诊断等关键词仍然为 2008 年的热门关键词。2008 年的研究热点与去年大体相同,只出现了老年一个新的热点关键词。而老年与老年人有些类似,所以属于同一个领域。结合表 11 与表 12 发现 2008 年里只有细胞凋亡是既具有较高的中介中心度又具有较大的出现频次的关键词,因而细胞凋亡是 2008 年的研究重点与热点内容。与以往相比,我们发现内科学对于疾病方面的研究相对减少了,对于细胞、治疗、诊断等方面的研究增多了。说明内科学的研究在向新的领域扩展,从表 11 中可以看出,具有较高的中介中心度的关键词一般均为新的领域,关于疾病的很少,表明内科学在随着时间的推移不断的发展。4.2 内科学分年度知识源流1) 2004 年内科学知识源流2004 年共计来源文献 6

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报