SciHub下载量成论文影响力预测指标:能被下载的论文被引次数高出72%

天下苦学术出版商久矣

鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

嗑盐的你,用过Sci-hub吗?

作为一个能免费看论文的学术搜索引擎,Sci-hub是科研人员的秘宝,同时,却也是学术出版商眼中的大毒瘤。

现在,有人站出来,用统计数据为Sci-hub正名:

能通过Sci-hub下载的文章的被引次数,是Sci-hub上下不到的文章的1.72倍

也就是说,Sci-hub的下载量,已经成为论文影响力的重要指标。

这个结果一公布,立刻引发了网友的共鸣:

我总要先能看文章,然后才能引用啊。

Sci-hub,让文章更具影响力

这项针对Sci-hub影响力的研究,被研究人员们公开放在了arXiv上。

研究人员认为,Sci-hub作为一个闻名全球的项目,对于学术体系中的所有人都影响深远。

因为它能绕过大多数学术出版商的付费墙,实际上增强了论文的潜在影响力。

他们希望通过数据证明,Sci-hub的下载量与论文未来的引用量是正相关的。

数据集

研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。

第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。

第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。

并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。

对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。

研究结果

根据引文统计分布,文章引用次数超过2000次的论文被视作离群值。

研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。

在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍(p<0.001)。

并且,Sci-hub下载量越高,论文的被引次数也越高。

在所有选定的期刊和涉及的学科中,Sci-hub的影响都很明显。

另外,结果也表明,图表丰富的论文更容易被引用。

研究人员认为,这样的Sci-hub效应具有多重意义。

第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。

第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。

在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。

不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。

影响全球学术界的Sci-hub

Sci-hub创建于2011年。创始人是一位来自哈萨克斯坦的研究生Alexandra Elbakyan。

科研女神,在线挥手

她的初衷很简单——天下苦学术出版商久矣。

毕竟,学术出版商是这样定价的:

对于一家上市公司来说,赚取多少利润合适,答案是“看市场能承受多少”。

以Elsevier为例,其订阅费每年都在上涨,到了2018年,加州大学(UC)系统平均每年要向Elsevier支付约1100万美元(约合7377万元人民币)的订阅费用。这还没完,在协商签订新协议的时候,这家出版商还要求继续提价。

而早在2012年,Elsevier公布的利润率就已经超过了40%。赚钱能力甚至超过了苹果、微软等科技巨头。

这样的巨额收费,一直被认为是在阻碍科学开放、知识民主。

而Sci-Hub不仅包含Elsevier,还提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆盖范围非常广。

所以,不仅是中国、印度这样的发展中国家给Sci-hub提供了大量下载量,Science网站2016年发布的一份报告显示,在2015年9月到2016年2月期间,美国本土就有115万次Sci-hub下载请求,仅次于俄罗斯位居第五。

这无疑动了学术出版商的蛋糕。单纯站在法律角度,也确属违法。

2015年11月,在Elsevier的控告下,Sci-hub域名遭到封锁。从此Sci-Hub开始了流浪之旅,迁移到美国无法管辖的地方,网址频频更换。

创始人Elbakyan也为了避免被引渡到美国,开始四处躲藏。Science网站评价她是“可敬的利他主义抑或大型犯罪者,而这取决于你的立场。”

但无论如何,学术出版商利用长久以来积累的名望,使科研人员们不得不为职业生涯考虑,接受其昂贵的订阅收费服务,甚至被限制在论文发表后公开免费放出论文,这样的现状,负面影响正在慢慢显现。

正如这项研究中谈到的,对论文的访问限制,可能会导致科学研究无法充分发挥其影响力。

你觉得呢?

传送门

论文地址:https://arxiv.org/abs/2006.14979

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。