乾明 发自 凹非寺
量子位 报道 | 公众号 QbitAI
2019年,做数据分析和机器学习,大家都喜欢什么样的工具?
著名的数据分析社区KDnuggets发布调查,给出了最新结果:
Python持续领跑;2019年有近半用户使用过深度学习工具;PyTorch增长速度是Tensorflow的13倍……
近20年来,KDnuggets每年都会进行一次调查,来研究数据分析和机器学习领域各个工具的使用情况,已然成为观测这一行业变化与趋势的重要参考依据。
Python依旧最热,R语言持续下降
首先,他们给出的是总榜。将数据分析和机器学习领域所有的工具,包括编程语言、框架等放在一起比较:
Python使用比例为65.8%,与2018和2017年相比持续增长。
排名第二的是名为RapidMiner数据分析软件平台,使用比例为51.2%,与2018年相比,略有下降。
R语言再次下降,回落到46.6%。但与2018年相比,下降速度已经有所放缓。
被Salesforce花费157亿美元重金收购的Tableau,排名第十,使用比例为22.1%。
在这个总榜中,深度学习框架Tensorflow(31.7%)和Keras(26.6%)等也都现身,不过增速与2018年相比,都有放缓。
虽然Pytorch没有出现在这个榜单中,但增速已不容小觑。
Pytorch势头凶猛
哪种工具增速最快?调查给出的结果是BigML,同比增长了199%;其次是Julia,增长150%。
对于机器学习领域来说,最值得注意的是PyTorch,增长达到76%。
这一增长速度是什么概念呢?比较一下便知道。
调查显示,2019年,有近一半(49.8%)被调查者都用过深度学习工具。
最热的是Tensorflow,但其增长速度仅为5.8%,PyTorch排在第三,占比11.3%,但增速是达到了75.5%,是Tensorflow的13倍。
相比之下,如DeepLearning4J(-25.6%)、Caffe(-58.3%)等工具,都出现了大幅度下降。
Spark是大数据工具王者
在大数据分析领域,Apache Spark(21.0%)最热,但与2018年相比,还是出现了下降(-2.3%)。
而Hadoop: Open Source Tools(12.1%)虽然位于第二,但其依旧保持着10%以上的增速(10.2%)。
编程语言,排名前五只有Python在涨
最后,只看数据分析和机器学习领域中使用到的编程语言的话,排名前五的编程语言中,除了Python有0.2%的增长,其他的几种语言,比如R语言(-4.0%)、SQL语言(-17.2%)、Java(-17.7%)、Unix shell/awk(-13.4%)等都在下降。
相比之下,Julia(150.4%)、Perl(25.2%)、Lisp(46.1%)等语言都在快速增长。
关于这项调查
这项调查中,普通的参与者平均选择了6.1种不同的工具。
其中,有180名参与者只选择了一种工具。这种情况下,KDnuggets判定其不能代表在数据分析/机器学习领域工作的人们,因此将这些选择删除了。
调查链接:
https://www.kdnuggets.com/2019/05/poll-top-data-science-machine-learning-platforms.html
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ’ᴗ’ ի 追踪AI技术和产品新动态