中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多

不止论文数量,论文质量也在大幅度提升

中国的AI研究,正在超越美国。

这次,不是中国机构自吹自擂,而是艾伦人工智能研究所发布的数据,其中无论是论文总数,还是高引用论文的数量,中国都正在超越美国。

2005年起,中国AI论文总数更多

先来看看论文总数。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多
△ 图表来自WIRED

早在2005,中国的AI论文总数就以98篇的微小差距超越了美国。而后更是节节高升,到2010年达到了顶峰,当年发表的AI论文总数超过3万篇,而美国当年的AI论文总数则是16000多篇,只比中国的一半多一点。

之后几年有一些下降,但随着2017年产业界的新一波AI浪潮的出现,这个数据再度急剧增长,去年国内总共产出AI论文超过27000篇。

相比较之下,仿佛美国才是那个急追猛赶的国家。

高引论文占比上升

当然,论文数量多不意味着AI科研水平高,毕竟,海量学术论文里,价值总是集中在少部分的几篇,增加一下分母并没有太高的难度。

真正有价值的在于引用,论文被别人引用才意味着这项研究有较高的参考价值,很可能是某一领域的奠基性、标志性研究。

比如Ian Goodfellow关于GAN的论文,之后几乎所有相关论文都参考了他的研究成果。

在高引用论文上,中国研究者的论文虽然总数没有美国高,但艾伦AI研究所总结了过往的数据趋势后,得出一个结论:

中国的高引AI论文,迟早会比美国多的

这个结论来源于三张统计图。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多
△ 引用次数前50%的AI论文中美占比

这是所有论文中,引用次数前50%的论文中美各自的占比。去掉了后一半,只保留前一半,可以说这个范围内的论文相对严谨、靠谱。

艾伦AI研究所还给出了趋势预测,可以看出,到明年,这一部分论文中美所占比例将持平,各自占到四分之一左右;而后,便是中国大幅度领先。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多
△ 引用次数前10%的AI论文中美占比

这张图则换成了前10%,十中选一,已经是相对高质量的论文了。

从图中趋势来看,美国的占比在不断下降,中国的占比则在持续上升,2021年,在引用次数前10%这个范围内,中国的AI论文数量将会开始超越美国,逐渐成为全球最多的国家,占比超过三分之一的量级。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多
△ 引用次数前1%的AI论文中美占比

终极PK来了,这张图里是全球引用次数前1%的AI论文,也就是真正具有最高影响力、最高学术价值的那一小撮。

而在这前1%的PK中,美国几乎是停滞不前的,中国则照样告诉前进,虽然看似占比没有前面两类那么高,但大力出奇迹,论文总数基数大了,总能出现更多优秀的论文。

根据图中预测,按照这种速度发展的话,2025年,在TOP 1%的AI论文中,中国占比也将超越美国,双方各占半壁江山,而其后,中国产出的更多AI论文势必将中国推上AI第一大国的宝座。

在这个过程中做出重要贡献的,则是以下9家机构。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多

被引用次数最多的中国学术机构前五名分别是中科院、清华、港中大、香港科技大学和上海交大,他们的被引用总次数均超过了10万。

不过,在各顶会的最佳论文中,美国学者依然处在领先地位,不过也有不少中国的优秀论文拿到顶会最佳论文,比如CVPR 2017最佳论文《Densely Connected Convolutional Networks》一作就是清华姚班13级的本科生刘壮,而且根据Google Scholar显示,这篇论文的引用次数已经超过了3000次。

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多

不过,以上提到的中美分类并不是完全一刀切,毕竟有很多研究成果是中美两国不同机构的学者合作完成的,所有被统计的论文中,中美两国各有大约二十分之一是合作论文。

另外,艾伦AI研究所也说明了基础数据中的一点偏差,不到2%的中国论文来自以.com而非.cn结尾的研究机构,因而被自动计入了美国;另外因为基础数据缺陷,没有统计微软亚洲研究院的论文。

而且,因为中美的分类是按照机构来的,有一些美国高校发表的论文,作者其实都是去留学的中国人,总有一部分人才是要回国的嘛。

其他机构也赞同

如果单看艾伦AI研究所的数据尤其是预测数据,难免有一丝“中国威胁论”的感觉。实际上,最近还有两份报告也说明了中国的AI实力。

斯坦福AI Index:中国AI论文被引用次数大幅提高

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多

最新版的斯坦福AI Index报告中提到,AAAI的论文中,70%来自美国或中国,两国获接收的论文数量相近,但中国提交的论文总量比美国多30%,可见中国学者的积极性之高。

而基于经同行评议论文数据库Scopus的数据,2018年发布AI论文最多的地区前三甲分别是欧洲(28%)、中国(25%)和美国(17%),这项数据中,中国再次超过了美国。

说明论文数量的总数高了,说明论文质量的被引用次数也高了。与2000年相比,2016年中国AI学者论文被引用的次数,提高了44%。

而这背后,则是更多人才投入AI研究的热潮,清华2017年学AI和机器学习的学生数量,是2010年16倍。

CNNIC:北京是全球AI企业最多的城市

中国AI正在超越美国,高质量论文将全球第一,中科院清华贡献最多

国内机构的数据,也能说明中国AI的发展火热程度。

上个月底,CNNIC发布的第43次调查报告中提到,截至2018年11月,我国人工智能相关专利申请量已超过14.4万件,占全球申请总量的43.4%,居全球首位。

而在商业方面,截至2018年6月,中国AI企业数量已达到1011家,光北京就有395家AI企业,已经是全球AI企业最多的城市。

传送门

艾伦AI研究院博客原文

https://medium.com/ai2-blog/china-to-overtake-us-in-ai-research-8b6b1fe30595

CNNIC第43次调查报告:人工智能发展情况

https://tech.sina.com.cn/it/2019-02-28/doc-ihrfqzka9657844.shtml

版权所有,未经授权不得以任何形式转载及使用,违者必究。

相关阅读