Histcite使用教程(个人总结).pdf-道客多多

资源描述

1、Histcite 使用（ Histcite history of cite 引文历史） 1、读的文献要是精品，读精华的文献，不要读太多垃圾文章，你得到的都是垃圾信息。通过读文献来了解一个领域，就如同盲人摸象，最忌讳的就是得到的都是碎片化的信息，那样就很难保证能看清全貌！ 2、文献调研的目标：追踪进展，特定参考，基金申请。如何快速了解领域：综述，教材，专著，问专家。如何获得重要文献？向导师要，网站检索，文本分析，引文分析。但要记住，分析文献永远不能代替阅读文献。先知道该领域哪个人文章发得多，很可能他是该领域的大牛，然后再去找他写的综述。 3、 WOS 里面对文章进行引用次数降序排列时，有些时

2、候靠前的文章也不靠谱，因为那里统计的引用是全部的引用，有同行的，外行的引用。我们真的需要知道的是我们的同行到底引用了哪些文献，我这个领域内，到底哪些文献引用次数高！ 4、对于文献引用，要这样去理解：因为相关所以引用，引用相当于投票（赞一个 /顶一下）！共引即相关。 5、 Histcite 功能：快速描绘一个领域发展脉络，快速锁定某个领域内重要文献，快速锁定某个领域内专家和大牛。描绘新进展。还有一个重要功能是找出 “无指定关键词 ”的重要文献！ 6、数据下载（ WOS），导入 Histcite。注意，目前 Histcite 只能支持 WOS 中搜索得到的文献信息，例如从 Scopus，

3、中文数据库等文献信息它是不能分析。在WOS 数据库中进行检索时，我们选定一个检索关键词如 “ 自清洁 ” ，即“ self-cleaning” ，然后按主题项检索（检索范围设置成 “主题 ”，不要是 “标题 ”，那样得到的结果太少，引文分析我们希望得到的数据是尽量全面，不一定要百分百精确） 7、从导入的很多文献中， Histcite 可以挑出它分析后认为重要的几十篇文献（当然这个数值也可以调节，到底选用多少篇文章进行作图我们可以自由选择），然后列出它们之间的相互引用关系图。箭头被指说明这篇文献被引用，箭头指出表示引用别人。 Histcite 难度在于画出来引用图之后怎么去分析，因为有些时

4、候图很复杂，或者文献之间关联度很少，这时一方面需要检查你导进去的数据是否有错误，第二要尽可能根据学科特点去分析。 8、数据导出：如果检索结果很多的话我们只能每次 500 条输出，分几次进行（如先导出 1-500，再导出 501-582）： 9、先启动电脑上的浏览器（最好是 IE），然后双击启动 Histsite 软件（如果后面无法进行分析，则是右键 -以管理员身份运行软件），导入之前的文献数据，或者选中多个文件，拖拽到 Histcite 图标上，可以一次性添加多个文件： 10、 Histcite 分析后，我们要去看这些数据， records 所对应的数值就是之前在WOS 中用关键词

5、检索后导出到 text 文本中的文献数目，也就是解析来我要进行分析的文献总数； “cited references”表示的是你导入 Histcite 的那么多文献（当前数据集）它们总共引用的参考文献数目； Words 表示这些文献的关键词。为了下次进行分析的方便，我们可以 file-export-records，将分析结果保存为 hci 的文档（其实是一个 txt 文本），该文档 Histcite 能识别，下次启动 Histcite之后就 file-add file 打开那个 hci 的文件即可。不用再去导入一开始在 WOS 中导出来的好几个 txt 文本，方便操作。 9、

6、LCS， GCS， LCR， CR 四个参数是 Histcite 用于作图的关键参数，很重要： GCS（ GCS=global citation score，总引用次数： WOS 上看到的引用次数），表示某一篇文章被整个 WOS 数据库中的文献所引用的次数，有些引用这篇参考文献的文章可能和你的研究方向毫无关系，但 GCS 还是会把这个引用数据记录下来， WOS 中对搜索结果进行被引用次数降序排列时用的其实就是 GCS 数据。 LCS（ LCS=local citation score，本地引用次数：某篇文献在在当前数据集中被引用的次数），表示的是某一篇文章被你导入 Histcit

7、e 进行分析的这几百或几千篇文献所引用的次数。因为你导入 Histcite 的文章都是和你检索词有关的，可以认为这些文章是你的研究方向相关，因此如果某一篇文献的 LCS 值很高，意味着它肯定是你研究领域内的重要文献。因此相比而言， LCS 比 GCS 更重要些， LCS 高的极有可能是你领域内的开创性文章，因为很多人都引用它。一般LCS 高的文献和 GCS 高的文献不会是同一篇！ LCR（ LCR=local cited references，本地参考文献数，某一篇文章的参考文献在当前数据集中的数量），表示的是某篇文献引用别人的情况。根据 LCR 值的排序，可以快速定位近期关注该领

8、域的重要文献，因为某一篇文献引用当前数据集中的文献数越多，说明它非常关注你检索的这个研究方向的文献，和你的研究肯定有相似或者可参考之处，可以从该文章中发现新动向。 LCR 高的极有可能是你领域内的综述文章。 CR（ CR=cited references，某一篇文献在整个 WOS 数据中参考文献数），这个值越高，说明这篇文献很可能是综述性文献，可根据该值的排序，也可快速定位综述文献。 10、除了上面讲的 LCS， GCS， LCR， CR 四个值之外，我们也可以分析：作者 /机构 /期刊 /关键词分析 /发表年分析等： 11、用 Hsitcite 作图和读图： tools-graph

9、 maker，然后点击 “make graph”开始作图。作图时我们可以选用LCS 或 GCS 值作为参考，它们表示的是被引用情况。还可以设定选多少篇文献来进行分析作图。一般选择 GCS 作图的话线之间会疏一些，因为他们是全部被引次数的统计，这些文章之间的关系相对而言会少一些，我们一般都选择 LCS来作图。左边侧栏还可以设置很多参数值，如结点圆圈大小，里面数字大小，箭头类型等等，不做详细阐述。注意，作图时我们是选用 LCS/GCS，它们都表示被引用情况，因此有些时候一些新的文章因为年代近，因而被引用次数暂时还不多，所以它们在图中节点中被引用次数不会很多。另外，我们也能根据线的密集

10、与否来分析该领域近几年的研究情况，如果线很密集，说明那几年该领域研究很活跃，文献之间相互引用很频繁。但有些时候我们发现有那么几年线不是很密集，往往这种都是离现在比较近的，这并不代表这个领域这几年该领域不热门，因为可能是最近发表的文章因时间短，到现在为止被引用的次数还不多。另外，我们也可以从作图结果判断我们最开始在 WOS 中的关键词是否合适，如果作图结果显示我分析的文献之间的关联度很小，则说明我之前的关键词检索很可能是不合适的，需要修正。所以用Histcite 作图绝对不是一次搞定的事，而是需要不断修正和改善检索条件的一个过程。如果我们想把画出来的图进行保存，点击上面的 postscr

11、ipt，保存的是后缀为 .ps 的矢量图，用专门看矢量图的软件可以查看。或者可以用 Adobe Acrobat将矢量图转换成 PDF 文件进行查看。 12、 Hsitcite 辅助检索文献功能。要注意， Histsite 用于分析的数据来自于你导进去的文章信息，如果你只导了 100 篇文献，则 Histsite 最多就只分析那 100 篇之间的相互引用关系，所以选择哪些文献进行分析很重要。如果是研究你自己的领域，最好把 WOS 里面搜出来的你那领域相关的全部文献都导入 Histcite 进行分析，不要只分析那前面几百篇。因此，选择正确的检索词是非常重要的，这直接关系到后面的分析结果质量

12、。但无论选择什么检索词，肯定会有检索遗漏的文献，那我们如何通过 Histcite去找到它们？这就是下面所需要讲的：让 Histcite 帮助你找到未指定关键词的重要文献！（ Hsitcite 辅助检索文献功能）在 Histcite 显示栏的上面有 “cited references”，它后面往往跟了一个很庞大的数值，表示的是你导入 Histcite 的那么多文献（当前数据集）它们总共引用的参考文献数目，点击之后出现如下界面：有蓝色和黑色字体标题两种，蓝色的指的是这篇参考文献已经被你导入到Histcite 中进行分析了，即你最开始用关键词检索得到的几百或者几千篇文献中已经包含了

13、它，黑色就表示这篇文献没有在当前的数据集中，表示它们之前是被你遗漏了。而且我们往往能发现，排到最前面的几篇文献居然都是黑色的，它们其实非常重要，往往是这个领域的开山之作，但却在最开始的用关键词检索中被遗漏了！因为它们没有含有你之前检索的关键词，如果你只是通过关键词检索，是不可能找到它们的，但现在通过Histcite 的分析你可以找到这些被遗漏的重要参考文献。它们后面的Recs 值表示这篇文献在当前数据集中被引频次。那如何把它们添加进来呢？对于未被收录在当前数据集中的文献，我们发现其后面都有一个对应的绿色加号，如果我们点击该加号，会弹出一个窗口：如果我们希望这篇文章后面被

14、记录到当前数据集中的信息尽可能完整，那就在上面的框中把 Title 等信息通过点击 DOI 查询到后补充完整。点弹出窗口中的 apply changes，此时我们发现在 Histcite 窗口页面上方会出现红色字体的Update lists：点击它，即会发现当前数据集的 records 值增加了 1，说明这篇文献已经被加进来了，此时再 file-save，把修改后的信息保存在之前已经已经导出的 hci 文件中，下次再启动 hci 文件时就是更新之后的 records 列表了。此时，我们再做一些分析时，刚添加进来的那篇文献都会被纳入分析范围，能增加整体分析结果的完整性和可信度

15、！如果需要直接去文献所发表的期刊上下载和查看该文献，点击其对应的 DOI。如果需要详细查看该篇论文被引用的详细情况，点击后面的 WOS，进入如下页面：此时会发现怎么一片文献对应那么多行的信息，其实这是因为不同的文章在引用该参考文献时格式不一样，或者有些拼写错误，导致同一篇文章被重复显示了那么多次。这个问题我们不用纠结，一般而言，随便哪一行的信息都应该是正确的。点击后面的“ 查看记录在 Web of Science 中 ”，即可跳到 WOS 数据库中对应的该篇文章检索结果界面。 13、将分析后觉得需要的文献信息导入 Endnote 中。比如用 Histcite 分析了导进去的那几百

16、篇篇文献后，用 LCS 值排序锁定了重要的前 5 篇文献（也可以用其他值来进行排序），那我们可以用 “ tool-mark&tag” 功能，在红框中输入需要 mark的前 5 篇文献两个数值，即 1、 5，中间处选择 selected records only，再点击 mark，把 LCS 值前 5 的文献做标记，之后再点击最上面的 “ marks: 5” ：则页面只显示这 5 篇文献，如下图所示：然后 file-export -records ，输出该 5 篇文章信息（如果之前没点最上面的“ marks： 5” ，页面显示的还是全部的 records，且接下来输出的仍旧是全部文

17、献信息，不是 mark 的那几篇文献信息）。将得到的信息文件 rename （修改后缀为 txt），然后启动 Endnote 导入这 5 篇文章的信息，点 import-import option 选择 MULTI FILTER(SPECIAL) ，这样可以保留这 5 篇文章的 DOI 信息，方便后期处理。 5 篇文献的基本信息导入 Endnote以后，我们用其查找全文的功能去下载这 5 篇文章的全文。当然了，我们选择将哪些文献的信息输出，再导入到 Endnote 是完全可以根据需要来的，如我们也可以在 cited references 里面对文献进行 mark，然后再导出，不一定

18、要在导进去的 records 里面选择。 14、补充说明：一般我们看 Histcite 的窗口界面都是 Standard，横排上只显示四个参数值：LCS， GCS， LCR， CR。我们可以在 View 菜单中选择 Bibliometric，此时变成如下结果： LCS/t， /t 表示除以年代，表示平均每年被引用多少次， LCS/t 值越高，说明该文章每年都被大量引用，生命力强； LCSx，带 x 的都表示去掉自引的， LCSx 值越高，说明该文章被同行认可度越高； OCS 表示来自其他数据，没什么用； NA作者数，这篇文章有多少个作者； LCSb， b 表示 begain； LCSe， e 表示 end； LCS(e/b)=LCSe/LCSb，即两个数的比值。 LCSb 表示文章发表头 3 年被引用的次数， LCSe 表示文章最近 3 年被引用的情况。 LCS(e/b)越高表示该文章最近几年受关注程度很高，而之前比较少。

展开阅读全文