1、Histcite 使用( Histcite history of cite 引文历史) 1、读的文献要是精品,读精华的文献,不要读太多垃圾文章,你得到的都是垃圾信息。通过读文献来了解一个领域,就如同盲人摸象,最忌讳的就是得到的都是碎片化的信息,那样就很难保证能看清全貌! 2、文献调研的目标:追踪进展,特定参考,基金申请。 如何快速了解领域:综述,教材,专著,问专家。如何获得重要文献?向导师要,网站检索,文本分析,引文分析。但要记住,分析文献永远不能代替阅读文献。先知道该领域哪个人文章 发得多,很可能他是该领域的大牛,然后再去找他写的综述。 3、 WOS 里面对文章进行引用次数降序排列时,有些时
2、候靠前的文章也不靠谱,因为那里统计的引用是全部的引用,有同行的,外行的引用。我们真的需要知道的是我们的同行到底引用了哪些文献,我这个领域内,到底哪些文献引用次数高! 4、 对于文献引用,要这样去理解:因为相关所以引用,引用相当于投票(赞一个 /顶一下)!共引即相关。 5、 Histcite 功能:快速描绘一个领域发展脉络,快速锁定某个领域内重要文献,快速锁定某个领域内专家和大牛。描绘新进展。 还有一个重要功能是找出 “无指定关键词 ”的重要文献! 6、数据下载( WOS),导入 Histcite。 注意, 目前 Histcite 只能支持 WOS 中搜索得到的文献信息 ,例如从 Scopus,
3、中文数据库等文献信息它是不能分析。在WOS 数据库中进行检索时,我们选定一个检索关键词如 “ 自清洁 ” ,即“ self-cleaning” , 然后按主题项检索(检索范围设置成 “主题 ”,不要是 “标题 ”,那样得到的结果太少,引文分析我们希望得到的数据是尽量全面,不一定要百分百精确) 7、从导入的很多文献中, Histcite 可以 挑出它分析后认为重要的几十篇文献(当然这个数值也可以调节,到底选用多少篇文章进行作图我们可以自由选择),然后列出它们之间的相互引用关系图。箭头被指说明这篇文献被引用,箭头指出表示引用别人。 Histcite 难度在于画出来引用图之后怎么去分析 ,因为有些时
4、候图很复杂 ,或者文献之间关联度很少,这时一方面需要检查你导进去的数据是否有错误,第二要尽可能根据学科特点去分析。 8、数据导出:如果检索结果很多的话我们只能每次 500 条输出,分几次进行(如先导出 1-500,再导出 501-582): 9、先启动电脑上的浏览器(最好是 IE),然后双击启动 Histsite 软件 (如果后面无法进行分析,则是右键 -以管理员身份运行软件) ,导入之前的文献数据,或者选中多个文件,拖拽到 Histcite 图标上,可以一次性添加多个文件 : 10、 Histcite 分析后,我们要去看这些数据, records 所对应的数值就是之前在WOS 中 用关键词
5、检索后导出到 text 文本中的文献数目,也就是解析来我要进行分析的文献总数; “cited references”表示的是你导入 Histcite 的那么多文献 (当前数据集) 它们总共引用的参考文献数目; Words 表示这些文献的关键词。 为了下次进行分析的方便,我们可以 file-export-records,将分析结果保存为 hci 的文档 (其实是一个 txt 文本) ,该文档 Histcite 能 识别 ,下次启动 Histcite之后就 file-add file 打开那个 hci 的 文件即可 。不用再去导入一开始在 WOS 中导出来的好几个 txt 文本,方便操作。 9、
6、LCS, GCS, LCR, CR 四个参数是 Histcite 用于作图的关键参数,很重要: GCS( GCS=global citation score, 总引用次数: WOS 上看到的引用次数),表示某一篇文章 被 整个 WOS 数据库中的文献所引用的次数,有些引用这篇参考文献的文章可能和你的研究方向毫无关系,但 GCS 还是会把这个引用数据记录下来, WOS 中对搜索结果进行被引用次数降序排列时用的其实就是 GCS 数据。 LCS( LCS=local citation score,本 地引用次数:某篇文献在在当前数 据集中被引用的次数),表示的是某一篇文章 被 你导入 Histcit
7、e 进行 分析的这几百或几千篇文献所引用的次数。因为你导入 Histcite 的文章都是和你检索词有关的,可以认为这些文章是你的研究方向相关,因此如果某一篇文献的 LCS 值很高,意味着它肯定是你研究领域内的重要文献。 因此相比而言, LCS 比 GCS 更重要些, LCS 高的极有可能是你领域内的开创性文章,因为很多人都引用它。 一般LCS 高的文献和 GCS 高的文献不会是同一篇! LCR( LCR=local cited references, 本地参考文献数,某一篇文章的参考文献在当前数据集中的 数量),表示的是某篇文献引用别人的情况。根据 LCR 值的排 序,可以快速定位近期关注该领
8、域的重要文献,因为某一篇文献引用当前数据集中的文献数越多,说明它非常关注你检索的这个研究方向的文献,和你的研究肯定有相似或者可参考之处,可以从该文章中发现新动向。 LCR 高的极有可能是你领域内的综述文章。 CR( CR=cited references, 某一篇文献在整个 WOS 数据中参考文献数),这个值越高,说明这篇文献很可能是综述性文献 ,可根据该值的排序,也可 快速定位综述文献。 10、除了上面讲的 LCS, GCS, LCR, CR 四个值之外, 我们也可以分析:作者 /机构 /期刊 /关键词分析 /发表年分析等 : 11、用 Hsitcite 作图和读图: tools-graph
9、 maker,然后点击 “make graph”开始作图。作图时我们可以选用LCS 或 GCS 值作为参考,它们表示的是被引用情况。还可以设定选多少篇文献来进行分析作图。 一般选择 GCS 作图的话线之间会疏一些,因为他们是全部被引次数的统计,这些文章之间的关系相对而言会少一些, 我们一般都选择 LCS来作图 。 左边侧栏还可以设置很多参数值 ,如结点圆圈大小,里面数字大小,箭头类型等等,不做详细阐述。 注意,作图时我们是选用 LCS/GCS,它们都表示被引用情况,因此有些时候一些新的文章因为年代近,因而被引用次数暂时还不多,所以它们在图中节点中被引用次数不会很多。 另外,我们也能根据线的密集
10、与否来分析该领域近几年的研究情况,如果线很密集,说明那几年该领域研究很活跃,文献之间相互引用很频繁。但有些时候我们发现有那么几年线不是很密集,往往这种都是离现在比较近的,这并不代表这个领域这几年该领域不热门,因为可能是最近发表的文章因时间短,到现在为止被引用的次数还不多。 另外,我们也可以从作图结果判断我们最开始在 WOS 中的关键词是否合适,如果作图结果显示我分析的文献之间的关联度很小,则说明我之前的关键词检索很可能是不合适的,需要修正。 所以用Histcite 作图绝对不是一次 搞定的事,而是需要不断修正和改善检索条件的一个过程。 如果我们想把画出来的图进行保存,点击上面的 postscr
11、ipt,保存的是后缀为 .ps 的矢量图,用专门看矢量图的软件可以查看。 或者可以用 Adobe Acrobat将矢量图转换成 PDF 文件进行查看。 12、 Hsitcite 辅助检索文献功能 。 要注意, Histsite 用于分析的数据来自于你导进去的文章信息,如果你只导了 100 篇文献,则 Histsite 最多就只分析那 100 篇之间的相互引用关系,所以选择哪些文献进行分析很重要。如果是研究你自己的领域,最好把 WOS 里面搜出来的你那领域相关的全部文献都导入 Histcite 进行分析,不要只分析那前面几百篇。 因此,选择正确的检索词是非常重要的,这直接关系到后面的分析结果质量
12、。但无论选择什么检索词,肯定会有检索遗漏的文献,那我们如何通过 Histcite去找到它们?这就是 下面所需要讲的:让 Histcite 帮助你找到 未指定关键词的重要文献!( Hsitcite 辅助检索文献功能) 在 Histcite 显示栏的上面有 “cited references”,它后面往往跟了一个很庞大的数值,表示的是你导入 Histcite 的那么多文献 (当前数据集) 它们总共引用的参考文献数 目 , 点击之后出现如下界面: 有蓝色和黑色字体标题两种,蓝色的指的是这篇参考文献已经被你导入到Histcite 中进行分析了,即你最开始用关键词检索得到的几百或者几千篇文献中已经包含了
13、它,黑色就表示这篇文献没有在当前的数据集中,表示它们之前是被你遗漏了。 而且我们往往能发现,排到最前面的几篇文献居然都是黑色的,它们其实非常重要, 往往是这个领域的开山之作, 但却在最开始的 用关键词 检索中被遗漏了! 因为它们没有含有你之前检索的关键词,如果你只是通过关键词检索,是不可能找到它们的,但现在通过Histcite 的 分析你可以找到这些被遗漏的重要参考文献。 它们后面的Recs 值表示这篇文献在当前数据集中被引频次。 那如何把它们添加进来呢? 对于未被收录在当前数据集中的文献,我们发现其后面都有一个对应的绿色加号,如果我们点击该加号, 会弹出一个窗口: 如果我们希望这篇文章后面被
14、记录到当前数据集中的信息尽可能完整,那就在上面的框中把 Title 等信息通过点击 DOI 查询到后补充完整。 点 弹出窗口中的 apply changes, 此时我们发现在 Histcite 窗口页面上方 会出现 红色字体的Update lists: 点击它, 即会发现 当前数据集的 records 值增加了 1, 说明这篇文献已经被加进来了,此时再 file-save,把修改后的信息保存在之前已经已经导出的 hci 文件中,下次再启动 hci 文件时就是更新之后的 records 列表了。 此时,我们再做一些分析时,刚添加进来的那篇文献都会被纳入分析范围,能增加整体分析结果的完整性和可信度
15、! 如果需要 直接去文献所发表的期刊上 下载和查看该文献,点击其对应的 DOI。如果需要详细查看该篇论文被引用的详细情况,点击后面的 WOS,进入如下页面: 此时会发现怎么一片文献对应那么多行的信息,其实这是因为不同的文章在引用该参考文献时格式不一样,或者有些拼写错误,导致同一篇文章被重复显示了那么多次。这个问题我们不用纠结,一般而言,随便哪一行的信息都应该是正确的。 点击后面的“ 查看记录在 Web of Science 中 ”, 即可跳到 WOS 数据库中对应的该篇文章检索结果界面。 13、将分析后觉得需要的文献信息导入 Endnote 中。 比如用 Histcite 分析了导进去的那几百
16、篇篇文献后,用 LCS 值排序锁定了重要的前 5 篇文献(也可以用其他值来进行排序),那我们可以用 “ tool-mark&tag” 功能,在红框中输入需要 mark的前 5 篇文献两个数值,即 1、 5,中间处选择 selected records only,再点击 mark,把 LCS 值前 5 的文献做标记, 之后再点击最上面的 “ marks: 5” : 则页面只显示这 5 篇文献,如下图所示: 然后 file-export -records ,输出该 5 篇文章信息 (如果之前没点最上面的“ marks: 5” ,页面显示的还是全部 的 records, 且 接下来输出的仍旧是全部文
17、献信息,不是 mark 的那几篇文献信息) 。 将得到的信息文件 rename (修改后缀为 txt),然后启动 Endnote 导入这 5 篇文章的信息 , 点 import-import option 选择 MULTI FILTER(SPECIAL) ,这样可以保留这 5 篇文章的 DOI 信息,方便后期处理。 5 篇文献的基本信息导入 Endnote以后,我们用其查找全文的功能去下载这 5 篇文章的全文。 当然了,我们选择将哪些文献的信息输出,再导入到 Endnote 是完全可以 根据需要来的,如我们也可以在 cited references 里面对文献进行 mark,然后再导出,不一定
18、要在导进去的 records 里面选择。 14、补充说明: 一般我们看 Histcite 的窗口界面都是 Standard,横排上只显示四个参数值:LCS, GCS, LCR, CR。 我们可以在 View 菜单中选择 Bibliometric,此时变成如下结果: LCS/t, /t 表示除以年代,表示平均每年被引用多少次, LCS/t 值越高,说明该文章每年都被大量引用,生命力强; LCSx,带 x 的都表示去掉自引的, LCSx 值越高,说明该文章被同行认可度越高; OCS 表示来自其他数据,没什么用; NA作者数,这篇文章有多少个作者; LCSb, b 表示 begain; LCSe, e 表示 end; LCS(e/b)=LCSe/LCSb,即两个数的比值。 LCSb 表示文章发表头 3 年被引用的次数, LCSe 表示文章最近 3 年被引用的情况。 LCS(e/b)越高表示该文章最近几年受关注程度很高,而之前比较少。