不懂AI的我，是如何搞开发的？

十三 2020-10-14 03:44:43 来源：量子位

Everyone Can AI

金磊发自凹非寺

量子位报道 | 公众号 QbitAI

高达86%，这就是目前市场对「定制开发AI模型」需求的占比。

但在这个过程中，企业用户和开发者往往存在着以下诸多问题：

缺少模型训练经验
数据采集和标注成本较高
模型适配与部署流程非常繁琐
模型优化迭代周期长

那么，是否存在一种工具，能够「一站式解决」上述问题呢？

百度EasyDL了解一下。

简单来说，EasyDL极大降低了深度学习的应用门槛：

把AI开发这件事情，搞得像使用「家用电器」一样简单。而且训练产出的AI模型质量，如同高级工程师产出的一样专业。

但其实，百度早在2017年底便推出了EasyDL，2018年初正式开放，与此同时提出了一个愿景——Everyone can AI。

那么时隔近三年，这一愿景走到了哪一步呢？

像用家电一样的AI，能有多靠谱？

先来整体看下EasyDL所具有的三大特点：

极简的交互和使用流程，最快15分钟即可完成模型训练；
高精度的训练效果，比如图像分类模型的线上平均准确率在99%以上；
部署方式丰富，全面支持云、端、边部署。

首先是EasyDL的易用性、低门槛。

使用流程只有简单的四步，分别是「创建模型」、「准备数据」、「训练模型」和「部署应用」。

并且，在整个过程当中，都是可视化图形操作，这就大大降低了企业、开发人员的使用门槛。

用百度AI平台研发部技术总监忻舟的话来说就是：

不用一行代码也可以基于需求和数据，定制自己的AI解决方案。

在工业制造的生产质检领域，以「爱包花饰」为例，在监测箱包生产过程中的残留异物（针、金属零部件等）时，使用EasyDL训练箱包质检模型，在完全无需了解AI算法细节前提下，也训练出了准确率90%的模型。

再以「瀚才猎头」为例，几名人力资源专家在不了解AI算法的情况下，使用EasyDL，完成了简历数据的结构化处理和自动分类模型，大大提升了工作人员在简历检索方面的效率。

但简单，并不意味着会忽略掉专业性。相反，二者是「兼容且并行」。

依旧是「瀚才猎头」的案例，作为一家高级管理人员代理招募机构，其储备了200万条不同行业的企业和人才信息。

但一个非常「致命」的问题就是：200万条数据因简历检索的低下，使人才库的利用率不足10%。

而在使用EasyDL之后训练多个模型推进简历数据的结构化处理，仅在「候选人职能」和「候选人职级」两个模型上的识别率便达到了95%以上。

而以关键词搜索的任务中，瀚才猎头以往每天只能找到60-70份合适的简历。但现如今，20分钟就可能达到600-1000份，而且精准度达到了95%。

一言蔽之，百度EasyDL不仅让企业在「定制AI模型」上，使用起来像家用电器一般简单，并且还能像高级AI工程师一样专业。

除此之外，EasyDL还支持公有云API、私有服务器部署、设备端SDK、软硬一体方案等丰富的模型部署方式。

例如在软硬一体方案部署上，EasyDL提供了6款软硬一体方案，支持专项适配与加速，覆盖高中低全矩阵，模型识别速度可提升10倍。

不仅丰富，还非常快——最快仅5分钟即可集成。

而EasyDL这一切的优异特性，离不开其背后的技术硬实力。

EasyDL的能力是如何实现的？

表面上看起来、用起来越是简单的工具、平台，那它背后的设计可能越是复杂。

百度EasyDL也是如此。

平台内部采用了诸多复杂的深度学习算法和工程技术，而这一切，都是为了保证其简单、易用、低门槛的使用效果。

EasyDL之所以能够在模型方面达到高精度，一个重要原因是其基于百度自主研发的深度学习平台飞桨。一站式模型训练和服务体验，则融入了更多百度长期积累的独有技术和工程化能力。

首先，EasyDL预置了百度超大规模数据训练的预训练模型。

在视觉任务中，图像分类训练任务内置百度基于海量互联网数据，包括10万+分类、6500万图片等训练的超大规模视觉预训练模型，平均精度可提升3.24%-7.73%。

在物体检测训练任务方面，内置百度基于800+标签、170万图片，1000万+检测框训练的超大规模物体检测预训练模型，平均精度可提升1.78%-4.53%。

在自然语言处理方面，EasyDL预置了由百度自研、业界效果最好的预训练模型文心（ERNIE），将机器语义理解水平提升到一个新的高度。

EasyDL还提供了自动数据增强、自动超参搜索等AutoML/DL自动化建模机制，对零算法基础的用户降低AI使用门槛。

而且基于飞桨DGC加速机制，通过只传送重要梯度（稀疏更新）的方式来减少通信带宽使用，从而让EasyDL提升了分布式训练效率，相比传统分布式训练方式，有70%以上的训练速度增益。

其次，在数据处理方面，EasyDL建设了EasyData智能数据服务平台。

在数据标注和数据清洗，EasyData提供了11种数据标注模板，5种标准、高级的清洗方案。

EasyData还提供了软硬一体、端云协同的自动数据采集方案，可以在数据采集时，免除繁琐耗时的设备选型、调试和集成开发工作。

最后，在部署部署方面，EasyDL提供了公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。

其中，公有云API可以支持弹性扩缩容；设备端SDK目前EasyDL提供了端模型适配服务，支持了15+芯片类型，4大常用操作系统。

而这些，正是EasyDL强大能力的背后硬实力。

Why EasyDL？

因为有需求，这就是问题的答案。

人工智能引领的第四次工业革命正不断地渗透到各行各业，大企业往往具备了一定的人才储备、技术积累。

但相比之下，中小企业在智能转型的过程中，往往处于碰壁的状态，智能化门槛过高，包括高级开发人员成本、技术能力等等。

而中小企业在整个国民经济的发展过程中，却起着举足轻重的作用。

因此，解决这样的问题，便成为了一种「刚需」。

也正是因为这样，EasyDL一经开放，便得到了中小企业的广泛认可和支持。

而在2年多的时间里，EasyDL也一直在持续升级和打磨，使整体的产品体验和功能更加完善。

这也是让EasyDL与其它AutoDL平台相比，具有较为突出的优势，能够获得更好的效果。

不仅如此，EasyDL的更新迭代还在继续。

例如，今年升级的最大亮点，就是五月份全新发布了EasyData智能数据服务平台。

专注在AI开发场景在业内开放了提供一站式的数据采集、数据清洗、数据标注、数据回流的完整解决方案。

内置的超大规模预训练模型也是今年核心的技术亮点升级之一，为提供更高精度的训练效果。

而就在刚刚过去的9月，我们看到EasyDL又进行了一轮大幅升级。

在EasyDL经典版NLP方向新增了定制情感倾向分析、文本分类多标签、文本实体抽取；全新推出表格数据预测分析的ML方向，进一步丰富了模型类型。

数据服务上在已有的智能标注基础上重磅推出多人标注，让数据标注的效率进一步大幅提升。

全新上线模型市场，支持个人或企业将EasyDL经典版训练好的模型发布至市场进行售卖，并在业内首个创新性支持从市场已购买的模型结合数据进行再训练，实现更佳的模型效果。

未来，EasyDL还将继续发力：

除了扩展已有的 CV、NLP、ML、语音识别方向算法类型，还将推出OCR、视频追踪等定制化能力。
持续提升模型效果，提高训练速度，加速模型推理。
在数据、模型、服务等各个方面，持续降低使用门槛。

至此，可以说百度EasyDL离最初的「Everyone can AI」的愿景更加近了一步。

AI EasyDL 深度学习百度

十三

不懂AI的我，是如何搞开发的？

像用家电一样的AI，能有多靠谱？

EasyDL的能力是如何实现的？

Why EasyDL？

相关阅读

AI独角兽增援抗疫拉锯战，旷视守“城”，依图出“机”

百度集团副总裁吴甜：技术创新持续为产业注入新动能 | MEET2022

RTX 3090 AI性能实测：FP32训练速度提升50%，张量核心缩水

ICCV 2021：单目摄像头实时感知车辆形状，显著提高3D目标检测性能 | 百度出品

一个小度科技就估值200亿，百度现在被低估了吗？

如何评价百度造车？字很少，事很大

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此