被冒犯了:6个实验报告满天飞了

2022-04-27 17:37:21 浏览数 (1)

温故6年前做的信息计量学的实验报告,有一些疑问,当我打开搜索知道一下,我有点吃惊了。

TOP3的结果都是自己的实验报告,开心也有点害怕,网络平台转载文章,作者却一无所知,有点尴尬了。

与其被搬运,不如自己主动分享;实验中我们验证前辈们的经验所得,可以深刻的理解原理,学以致用,站在巨人的肩膀上登高望远。

一、实验目的

通过实验了解并掌握信息计量学中的六个重要的定律,文献增长定律,文献老化定律,洛特卡定律,齐普夫定律,引文分析规律,布拉德福定律

二、实验设备、材料

计算机、原始分析数据、Excel表、Ucinet6.0软件等

三、实验内容与实验步骤

实验一:文献累积增长定律

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,文献积累增长定律的定义:1949年, 美国科学家和情报学家物理学博士普赖斯 (Derek de Slla.Price)研究发现, 日益增长的科学领域内的文献是按指数增长的。

三,根据文献积累增长定律的定义可知研究对象是关于「云计算」论文在不同年限的发表的累积量。

1.对发表年份的数据在Excel中进行分类汇总,局部效果图如1-1所示:

图1-1:分类汇总

2.统计出不同出版年的年发表论文量,并通过Excel表格的计算公式C3=C2 B3,生成发表论文的累积量。如图1-2所示:

图1-2:文献累积量图

3.对图1-2中的极端特别数据进行剔除或不选,选取适当的文献出版年和对应的发表论文累积量,在Excel选择插入图表,选择XY散点图,下一步,下一步,添加标题,去除网格线(可选),在Excel中生成效果图,如图1-3所示和图1-4所示:

图1-3:定律效果图一

图1-4:定律效果图一

实验二:文献老化定律

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,文献老化定律的定义:米哈伊洛夫定义为,科学文献随其‘年龄’的增长,失去了作为科学情报源的价值,以及因此越来越少被科学家和专家们利用。半衰期,表示已发表的文献情报中有一半已不适用的时间。莱普斯指数等于出版年不超过五年的被引文献数量除以被引文献总量的百分比。

三,根据文献老化定律的定义和对半衰期与莱普斯指数的了解,首先需要获取被引证文献的出版,对出版进行数据的分析。

1.登陆 中国社会科学研究评价中心:http://cssci.nju.edu.cn/ 操作如:2-1所示:

图2-1:操作图一

2.进入新版系统入口:操作图二如:2-2所示:

图2-2:操作图二

3.单击“高级检索”,进入高级检索页面,

图2-3:操作图三

4,选择检出的结果集,操作图四,如图2-4所示:

图2-4:操作图四

5,下载选中的结果集,操作图五,如图2-5所示:

图2-5:操作图五

6,将数据复制到Excel表中,分列获取引文的发表年,对年数据进行排序,效果图,如图2-6所示:

图2-6:效果图

4.查看数据表很容易知道:

发表时间较新文献数量的一半是4年之内发表的,所以半衰期是4年。

5.普赖斯指数:

是五年之内发表的总文献量/总文献量=23/44=0.523。

实验三:布拉德福定律

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,布拉德福定律的定义:相关论文在期刊中不是均匀分布的,而是具有明显的集中与分散规律,英国著名文献学家布拉德福最早发现文献的集中与分散规律,并提出了著名的“布拉德福定律”。

三,根据布拉德福定律的定义,实验的主要研究对象是文献发表所在的期刊,统计出不同期刊的刊载文献的数量,体现文献的集中与分散规律。

1,从数据源中抽出文献来源的数据,在Excel表中对文献来源的期刊进行分类汇总计数,效果图,如图3-1:

图3-1:效果图

2,通过Excel表计算出论文发表数量、期刊累积量、期刊累积量的对数、发表论文累积量等数据项,形成如图3-2所示:

图3-2实验数据表

3,选择刊累积量的对数、发表论文累积量数据项,然后再Excel表格中插入图片,xy散点图,本实验分别选取了数据的前1/3部分,前2/3部分,还有全部分别做出了如下效果图3-3,3-4,3-5所示:

图3-3效果图一

图3-4效果图二

图3-5效果图三

实验四:齐普夫定律

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,齐普夫定的定义:是对文献信息词频分布规律的总结,在这里就不赘言了。

三,根据齐普夫定律,研究的是文献中的词频和序号这两个变量之间的关系。

1、抽出数据源中关键字,在Excel表进行分列处理,然后将关键字复制到同一列数据栏中,对数据进行排序,然后进行分类汇总,计算出不同关键字在所选文献中出现的次数,制作出如图4-1所示的数据表

2,选取序号和关键字出现的数量进行,图表的插入,添加趋势线,显示公式,本次实现做了了两个,分别取出数据的全部和除去前10项数据,效果图如图4-2,4-3所示:

图4-2效果图一

图4-3效果图二

实验五:洛特卡定律

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,洛特卡定律的定义:从科学文献作者与其撰写的论文的纷乱现象中首先发现了“平方反比”的数量关系,提出了至今为止被人称为‘经典’的洛特卡定律。

三,洛特卡定律研究作者与写作文献数量之间的关系,分析出高产作者是所有文献作者总数的平方根。

1,对高产作者的统计,抽出作者数据项,对数据进行分列,将作者数据集中到一列数据栏中,进行分类汇总,按章数量进行汇总,统计出写不同篇数文章的作者人数,形成如图5-1所示的数据表:

图5-1数据表

2,选取上图中的数据A3到B6区域的数据,插入散点型数据表,添加趋势线,并显示公式,效果图如图5-2所示:

图5-2效果图

实验六:引文分析规律(共词分析)

一,在中国知网下载相关数据,本实验的研究主题为“云计算”下载数据包括论文的作者、题名、文献来源、发表年、卷、期、页码、关键词。总数据的记录的条数为600条。

二,引文分析规律的定义:在科学文献体系中,科学文献之间并不是孤立的,而是相互联系的。现代科学文献,尤其是科技期刊论文有一个很重要的书面特征,就是在之后罗列出作者参考、借鉴较早发表的文献。

科学文献的相互关系突出的表现在文献的相互引用方面,形成了科学论文之间的引用与被引用关系。引用文献是科学论文的基本属性之一,科学文献的相互引证关系是引文分析的主要依据。又称共词分析

三,引文分析规律,通过关键词找到文献与文献之间存在的某种联系。

1,抽出关键字,进行分列,对每一列关键词,两两进行排列组合,然后进行扩展型排序,最后将每一列数据,都再复制到对方数列的下方,保证两列数据的对称型,删除不对称的多余数列。如图6-1所示

图6-1两列数据

2,选中两列组合好的数据,在Excel表中做透视表,效果图如图6-2所示:

图6-2数据透视表

3,打开预先安装好的Ucinet 6 for Windows软件,将透视表中的数据复制到下图的数据栏中,如图6-3所示:然后保存数据,两种文件格式:##d和##h。

图6-3样图

4,在netdraw中打开你保存的##h格式的数据,打开步骤如下图6-4、6-5所示:

图6-4步骤一

图6-5步骤二

5,生成的效果图如图6-6所示:

图6-6最终效果图

通过词网,我们一眼看清云计算的的研究点,心有全局对我们学习云计算很有帮助。

四、实验总结

通过实验加深了对信息计量公式的理解,掌握了信息计量方法,为以后的学习和工作打下了基础。

信息计量学主要内容:

三个应用范围:核心期刊的测定、信息资源的管理、科学评价;

四个方法:引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法;

五个定律:增长规律、老化规律、集中与分散规律、作者分布规律、词频分布规律。

0 人点赞