科研文献工具Histcite介绍

2022-12-05 16:58:09 浏览数 (1)

导师给研究方向,课题就是简单的一句话,几个字,其余的一切都要靠自己摸索,所以会搜索文献是一项极其影响效率和工作质量的技能。 我研一也上过一门类似的讲科研文献检索,整理的课程,老师讲了web of science网站本身的文献分析技巧,也讲了对领域文献的跟踪订阅,但当时没有体会到这些技能的美妙之处,现在马上研二,磕盐压力越来越大,发现必须要对领域的文献有更加透彻深入的理解。

这个工具是某个失眠的夜里在知乎上逛到的。第二天到教研室就下载了一个,果然不错。可以通过它大概的把握一个领域的上下几十年。好东西要分享,于是就挂上来了,希望大家也能用它找到一个领域最经典的文章,从而快速入门,找到自己的方向,而不是迷失在文献的海洋里。

详细使用教程见知乎这篇专栏文章,写的很详细


下面是一个示例,调研一下强化学习的发展:

用校内局域网,通过学校的图书馆进入Web of Science网站,在核心合集数据库里检索你感兴趣的领域的文章,我通常按照被引频次降序排列,看需要吧,也可以按照日期降序,搜索到的文章导出到纯文本,一般比较新的领域我就导2000篇,比较热门的领域比如Deep Learning,就导个3000篇甚至更多,但是每一次只能导出500篇,所以要分多次导入,这是WOS网站本身的限制。

双击exe文件,输入3(要求整个安装路径没有中文字符),就会自动载入刚才从WOS导出的放到TXT文件夹的txt文本文件,并自动加载IE浏览器。

可以在工具条的“分析”一栏看到找到最有贡献的作者,研究机构,方便找到领域大牛以跟对方向,也可以看出这个领域的发展历史,哪几年文献少,哪几年突然火起来文献暴增·····
然后用Histcite软件做文献分析,绘制出最有贡献的30(数字可调)篇文献的关系图,于是从图中可以一目了然地获取很多信息。
  • LCS是同行引用量,GCS是总引用量,一般LCS数据更具有参考价值
  • 可以在工具栏调整字号,看的更清晰
  • 左边会给出年份,让你可以看到领域的发展脉络
  • 圆圈里的数字是文献的编号,这个只是为了跟上图的文献分析对上号,并不是WOS检索出来的顺序
  • 图中圆代表文献本身的被引量,圆圈越大的被引量越多,则越重要
  • b用箭头指向a文献,代表b文献引用了a文献。所以可以看出最重要的文献
  • 给出的30篇文献就是这个领域最重要的30篇文章了,可以进一步筛选出几篇经典文章精读,这样需要读的文献数量就少了,获得的信息却反而可能增多

调整节点和年份的字号大小后,可以看出:

  • 128,83都是很经典的高被引文献,很可能具有开创性的贡献
  • 455,563号文献本身被引量很高,又引用了很多高质量文献,很可能是高质量的综述性文章

当然,我通过文献分析中的期刊发现,研究强化学习的文章主要发表在生物医学类的期刊上,大致查看了30篇文献的 题目,确实几乎都是研究大脑学习机制的,再一查资料,才发现强化学习已经有一百多年的研究历史了,是个古老的传统的领域,而这种生物学习机制近年来才被引入到机器学习的领域里,在ML中是个新领域新方向。

但是这30篇文章里还是有机器学习领域的经典高贡献文章,比如 6号文献: A MORE BIOLOGICALLY PLAUSIBLE LEARNING RULE FOR NEURAL NETWORKS

0 人点赞