谷歌开源缩放模型EfficientNets：ImageNet准确率创纪录，效率提高10倍

晓查 2019-05-31 12:48:09 来源：量子位

文章已经被ICML 2019收录。

晓查发自凹非寺

量子位出品 | 公众号 QbitAI

最近，谷歌基于AutoML开发了EfficientNets，这是一种新的模型缩放方法。它在ImageNet测试中实现了84.1%的准确率，再次刷新了纪录。

虽然准确率只比之前最好的Gpipe提高了0.1%，但是模型更小更快，参数的数量和FLOPS都大大减少，效率提升了10倍！

开发EfficientNets是来自谷歌大脑的工程师Mingxing Tan和首席科学家Quoc V. Le，他们的文章《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》已经被ICML 2019收录，并在GitHub上开源了模型。

实现方法

传统提高CNN准确率的方法有：增加网络的深度或宽度，例如通过增加层数将ResNet-18可扩展到ResNet-200，或者是提高输入图片分辨率来训练和评估网络。

虽然这些方法确实提高了准确率，但是通常需要繁琐的手动调整，而且经常不能获得最优的性能。

最近谷歌提出了一种复合缩放（compound scaling）的方法，与缩放神经网络的传统方法不同，谷歌的方法使用一组固定的缩放系数统一缩放每个维度。

实现复合缩放的首先是执行网格搜索，以在固定资源约束下找到基线网络（baseline model）的不同缩放维度之间的关系，确定每个维度的缩放比例系数。然后将这些系数将应用于基线网络，扩展到所需的目标模型大小或计算力。

模型缩放的有效性也在很大程度上依赖于基线网络。因此，为了进一步提高性能，谷歌还使用AutoML MNAS框架优化了模型的准确率和效率，执行神经架构搜索来开发新的基线网络。

性能表现

EfficientNet模型实现了比现有CNN更高的精度和更高的效率，将参数数量和FLOPS降低了一个数量级。

特别需要指出的是，EfficientNet-B7在ImageNet上实现了目前最先进的测试结果，准确度为84.4％（top-1）和97.1％（top-5），同时比现有最好的Gpipe小了8.4倍，推理速度快6.1倍。

在同等算力的条件下，EfficientNet也有更好的表现。与ResNet-50相比，EfficientNet-B4的准确率为82.6%，比ResNet-50的76.3%高出6.3个百分点。

EfficientNets不仅在ImageNet上表现良好，迁移到其他数据集上也有优秀的表现。为了评估这一点，谷歌在8个广泛使用的迁移学习数据集上测试了EfficientNets，其中5个实现了最先进的准确度。它在CIFAR-100上准确度为91.7％，在Flowers上为98.8％，同时参数减少了21倍。

传送门

博客地址：

https://ai.googleblog.com/2019/05/efficientnet-improving-accuracy-and.html

开源地址：

https://arxiv.org/abs/1905.11946

ImageNet 计算机视觉谷歌

晓查

谷歌开源缩放模型EfficientNets：ImageNet准确率创纪录，效率提高10倍

相关阅读

谷歌扔下芯片核弹：开源全球首个可制造的PDK，免费帮有缘人实现造芯梦想

ChatGPT吸走谷歌人才，谷歌云CEO：AI新游戏刚开场，莫慌

大数据已死！从业10年老哥爆文抨击：这套唬不住客户了

谷歌新操作系统Fuchsia网站上线，同时支持手机和PC，鼓励开发者参与进来

创新奇智国际顶级视觉大赛PASCAL VOC夺冠，彰显AI视觉算法实力

性能超越何恺明Mask R-CNN！华科硕士生开源图像分割新方法

热门文章

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

智能车速度刷新：仅10个月，首个纯端侧大模型上车量产！

一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模型成本降了6成？！

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

电视装了智能体，只凭台词就能找到剧集了