机器学习免费跑分神器：集成各大数据集，连接GitHub就能用，还能验证论文结果

鱼羊

栗子 2019-10-12 12:38:51 来源：量子位

好评如潮

栗子鱼羊发自凹非寺

量子位报道 | 公众号 QbitAI

搞机器学习的小伙伴们，免不了要在各种数据集上，给AI模型跑分。

现在，Papers with Code (那个以论文搜代码的神器) 团队，推出了自动跑分服务，名叫sotabench，以跑遍所有开源模型为己任。

有了它，不用上传代码，只要连接GitHub项目，就有云端GPU帮你跑分；每次提交了新的commit，系统又会自动更新跑分。还有世界排行榜，可以观察各路强手的成绩。

除了支持各大主流数据集，还支持用户上传自己的数据集。

也可以看看，别人的论文结果，到底靠谱不靠谱。

比如说，fork一下Facebook的FixRes这个项目，配置一下评估文件：

然后一键关联，让Sotabench的GPU跑一下ImageNet的图像分类测试。

就能得到这样的结果：

Top-1准确率，Top-5准确率，跟论文的结果有何差距（见注），运行速度，全球排名，全部一目了然。

注：ε-REPR，结果与论文结果差距在0.3%以内时打勾，差距≥0.3%且比论文结果差显示为红叉，比论文结果好显示为勾+

这个免费的跑分神器，发布一天，便受到热烈欢迎：推特点赞600+，Reddit热度270+。

网友纷纷表示：这对开发者社区来说太有用了！

那么，先来看一下sotabench的功能和用法吧。

用法简单，海纳百川

团队说，sotabench就是Papers with Code的双胞胎姐妹：

Papers with Code大家很熟悉了，它观察的是论文报告的跑分。可以用来寻找高分模型对应的代码，是个造福人类的工具。

与之互补，sotabench观察的是开源项目，代码实际运行的结果。可以测试自己的模型，也能验证别家的模型，是不是真有论文说的那么强。

它支持跟其他模型的对比，支持查看速度和准确率的取舍情况。

那么，sotabench怎么用？简单，只要两步。

第一步，先在本地评估一下模型：

在GitHub项目的根目录里，创建一个sotabench.py文件。里面可以包含：加载、处理数据集和从中得出预测所需的逻辑。每提交一个commit，这个文件都会运行。然后，用个开源的基准测试库来跑你的模型。这个库可以是sotabench-eval，这个库不问框架，里面有ImageNet等等数据集；也可以是torchbench，这是个PyTorch库，和PyTorch数据集加载器搭配食用更简单。