15个产业级算法推出、35个高精度预训练模型上线!最强国产开源AI框架再进化,密集提升视觉产业实战能力

乾明 发自 凹非寺
量子位 报道 | 公众号 QbitAI

2项全新能力,4大重磅升级,35个高精度预训练模型上线,15个产业实践中广泛应用的视觉算法加持……

这就是最强国产开源深度学习框架——飞桨的最新重要升级。

在近日飞桨官宣的一系列新模型、新能力中:

  • 不仅有对主流模型的能力提升,比如大幅增强YOLOv3——训练提速40%,推理提速21%,精度提升4.3%;
  • 还纳入最新的SOTA模型,比如基于COCO数据集的精度最高开源模型CBNet;
  • 并上线了用于3D点云分类、分割和检测的PointNet++和PointRCNN模型,使其成为国内首家支持3D图像深度学习的开源平台;
  • 相应地,这些模型的开发、压缩、部署的“一条龙服务”也升级到全新版本,比如目标检测模型,使用蒸馏+裁剪模型压缩方案,基于COCO数据集进行测试,可以加速2.3倍。

更关键的是,像这样的全新发布与重大升级,飞桨一口气放出了6项,涉及15种算法和35个预训练模型,全部聚焦于视觉能力。毫不夸张地说,经此升级,飞桨在视觉领域的能力又出现一次大跨越。

而此时,距离飞桨上一次大升级只过了4个月左右。

如此密集的迭代升级为哪般?

结合之前工业化大生产、智能化产业升级,以及新基建蓄力,不难看出飞桨所指,不止于前沿技术突破,更在于产业应用和落地。

而且看过细节后,更让人深觉“拳拳到肉”。在百度自研AI芯片加持下,飞桨的新算法、新模型和新能力,也正通过智能云被输送到各种类型的流水线上。

具体细节,我们庖丁解牛,一点点看。

从强化到新增,视觉模型库升级

这次飞桨升级的核心是视觉能力。最直接的变化,发生在飞桨的基础模型库PaddleCV(智能视觉)中。

首先是PaddleCV能力范围进一步扩大。新版本的PaddleCV中,新增用于3D点云分类、分割和检测的PointNet++和PointRCNN模型。

和此前PaddleCV支持的数十种模型一样,基于飞桨框架,开发者无需全新开发代码,只要进行少量修改,就能快速在工业领域实现3D图像的分类、语义分割和目标检测任务。

而且模型精度也有保证。飞桨框架中,PointNet++在Indoor3D数据上分割精度(MSG)为86.6%;ModelNet40数据集上分类精度(MSG)达90%——直追SOTA。

借鉴了PointNet++和RCNN的思想的PointRCNN,作为业内领先的3D目标检测模型,在飞桨上实现,精度同样能够比肩SOTA。他们给出的实验结果是:在自动驾驶权威数据集 KITTI(Car)的Easy数据子集上,精度达86.66%。

其次,PaddleCV进一步将各个领域新出现的强大模型纳入进来。

比如在目标检测领域,新增了基于COCO数据集的精度最高开源模型CBNet、Libra-RCNN模型的(精度提升了2%),以及Open Images V5目标检测比赛最佳单模型。

飞桨还新增了IoU损失函数类型Generalized-IoU和Distance-IoU损失函数,在不增加预测耗时的情况下,模型精度再提升1%。

在图像语义分割方面,新增了对高分辨率模型HRNet、实时语义分割模型Fast-SCNN的支持。在目标追踪领域,新增了SiamFC、ATOM等算法模型。

但飞桨开发团队也并非“只听新人笑”,除了纳入更多模型,此前已经支持的主流模型,也在飞桨的升级中得到优化。

比如YOLOv3,在这次升级中大幅增强,精度提升4.3%,训练提速40%,推理提速21%;人脸检测模型BlazeFace,新增了NAS版本,体积压缩3倍,推理速度提速122%等等。

飞桨透露,这次新增产业实践中广泛应用的算法15个、35个高精度预训练模型之后,PaddleCV库中的高质量算法已经达到73个,预训练模型总数达到203个。

而且这些,还只是飞桨这次升级的一部分而已。

模型开发、压缩、部署“一条龙服务”增强

想要打造一个能够落地到场景中的AI应用,不仅要开发训/练模型,部署到应用场景中也是关键。

而在部署模型的过程中,还要针对部署的设备,调整压缩训练开发好的模型,使其能适应场景,且不丧失原有的精度。

围绕这方面的需求,飞桨同样强化了能力,最核心的提升在于模型压缩工具PaddleSlim、移动端部署框架Paddle Lite。

在过去一年中,PaddleSlim历经四个版本打磨,现在迎来了1.0版本——囊括了深度学习模型压缩中常用的量化、剪裁、蒸馏、模型结构搜索、模型硬件搜索等方法。

应用到百度人脸SDK中,它能够实现在嵌入式设备上,0.3秒内完成人脸检测、跟踪、活体检测、识别等全流程操作。

而这不过是它这次升级后的新特性之一。这样的特性,PaddleSlim1.0一共有10个。

比如,其针对YOLO系列模型开发的蒸馏方案,实现COCO任务的精度提高2%;使用裁剪模型压缩方案时,它能够大幅降低算力需求。在图像分割模型上,应用PaddleSlim1.0的压缩部署方案,FlOPS(算力)能减少51%。

而且,PaddleSlim1.0还开放了更加灵活的NAS API,预定义了更丰富的搜索策略和搜索空间。对比单卡SA搜索策略,单卡One-Shot策略实现搜索速度加快10倍以上等等。

PaddleSlim的这些特性,与最新版本的Paddle Lite结合,也进一步提升了飞桨的能力——将功能强大的深度神经网络部署到移动嵌入式设备端上。

此外,飞桨还新推出了大规模分布式训练工具PLSC,具备了千万规模分类的能力。据悉,PLSC能自动将全连接层参数切分到多GPU卡,可以将单机8张V100 GPU配置下支持的最大分类类别数扩大2.52倍。

而且训练精度和效率高:多个数据集上可以取得SOTA的训练精度,同时支持混合精度训练,单机8张V100 GPU配置下,混合精度训练速度提升42%。

开启PLSC混合精度训练方法。

更关键的是易用性。飞桨介绍称,只需要五行代码,在飞桨上就可实现千万类别分类网络的构建和训练,提供大规模分类任务从训练到部署的全流程解决方案。

可能也正是因为易用、不断丰富的能力,飞桨的生态也正在进一步完善。截止2019年,飞桨的开发者数量已经超过150万,是国内最大的AI开发者生态。

他们在将飞桨带到更多应用场景中的同时,也在为飞桨能力提升提供更多的帮助。

飞桨为什么能够实现快速发展,领衔中国深度学习平台市场(来自IDC数据)?他们功不可没。

此外,飞桨支持的硬件,尤其是国产芯片,也在进一步增多。据悉,继华为麒麟芯片之后,比特大陆最新算丰系列AI芯片也已经与百度飞桨深度学习平台的成功融合。

密集升级背后,为工业化大生产提供弹药库

模型库愈发充足,端到端开发部署一条龙服务再度强化,飞桨的目标变得愈发清晰——工业化大生产。

这也是百度AI的目标所向,在过去的一年中,李彦宏、王海峰多次对外明晰:AI技术已经进入工业大生产阶段,智能云作为载体,能够促进AI落地,加快产业智能化进程。

百度在如何推进这一战略?不断迎来密集升级的飞桨,就是他们打造的武器,在百度自研芯片的支撑下,正通过百度智能云输送到工业生产“前线”。

最新范例已经出现。3月15日,百度与微亿智造打造的工业智能质检设备,正式部署上线,双方合作构建完成了一个从智能硬件到算法软件再到算力供给的智能制造解决方案大闭环,实现算力2倍提升。

这背后,不仅仅有飞桨深度学习平台的支持,还有百度智能云、百度昆仑芯片支撑——这也是中国自研 AI芯片在工业领域的首次大规模应用。

而且, 不仅仅是智能质检等工业方面的落地部署,在这次抗疫中,基于飞桨、智能云、昆仑芯片的百度软硬一体化AI能力,也展现出了能力。

在2月10日的《新闻联播》中,出现了这样一则案例:

江苏常州的精研科技,借助百度与微亿智造联合打造的智能自动化监测设备“表面缺陷视觉检测设备”,解决了工人无法复工情况下的生产难题,十台无人值守的智能化检测设备24小时工作,比人工检测效率提升近10倍。

近来大环境、大趋势,疫情冲击之下,全球经济整体出现了不小的负面影响。但危中带机——最大的机会莫过于轰鸣阵阵的新基建。

何为“新基建”?核心涵盖,就是以新型智能化为方向的基础设施建设。而2月10日的《新闻联播》案例中,百度飞桨充当的,正是新基建需要的工具箱、弹药库。

然而,其中案例只是代表性的一例。

就目前而言,抗疫不断收尾的中国大地上,这样待升级的传统产业、等待智能化变革的场景,以及AI发挥价值的降本增效领域,还有很多很多……

飞桨一系列升级,或许只是春江水暖,但也可能是踌躇满志多年后恰逢其时。

总之,飞桨的新基建弹药库,现在已经准备好了。如果你是想抓住时代机遇的开发者,机会可别错过了。

最后,飞桨PaddleCV这次的升级详情,传送门如下:

https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV

版权所有,未经授权不得以任何形式转载及使用,违者必究。