5分钟“调教”一只机器狗,百度飞桨已经简单到这地步了吗?
国产深度学习春晚
金磊 梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI
“调教”一只机器狗学会新技能需要多长时间?
仅需5分钟。
一个往左走的手势,它就乖乖地向左挪了挪;一个“趴下”手势,机器狗狗就立马蹲了下去:
而且“狗狗”的视界也可以同步地展示出来。
这就是刚刚在Wave Summit+2021峰会现场中,百度飞桨秀出的AI新技能——自动高效的模型部署能力。
而这,只是这场年度深度学习开发者盛宴中的一隅。
但站在当下的时间节点,从现场种种的“技巧展示”中,无不在透露着人工智能技术发展的一种新信号——创新在融合,门槛在降低。
一方面,AI技术及产业的融合创新越来越多;另一方面,虽然AI技术越来越复杂,但AI开发与应用的门槛却越来越低。
百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在大会中所述:
深度学习推动人工智能进入工业大生产阶段。面向技术和产业发展需求的AI大生产平台可以让AI技术以标准化、自动化和模块化的方式输出给千行百业,实现规模化应用,同时以平台为基础促进融合创新、共同发展。
那么基于这样的“信号”,AI的发展在现阶段又呈现着怎样一种趋势?
对此,百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜表示:
全国各城市的AI开发者规模逐年增长,应用人工智能的企业数量,也呈现了多地开花、多行业繁荣的景象。
但正所谓“台上一分钟,台下十年功”。那么具体而言,在这些能力的背后,到底是什么样的AI技术在加持,又是如何发挥着作用?
接下来,老规矩,我们一文看尽WAVE SUMMIT+2021。
飞桨再升级,炼大模型不忘开源看家本领
百度飞桨,中国首个自主研发、开源开放的产业级深度学习平台,便是“台下十年功”的奥义之一。
这次飞桨公布了新版全景图,值得一提的是,其中的产业级模型库新增了百度刚刚新发布的产业级知识增强文心大模型,多年积累,让大模型真正走进了生产应用。
在百度飞桨平台上,开发者可以实现AI模型的便捷开发、高效训练和多端多平台部署。
对此,王海峰认为百度飞桨已经成为典型的AI大生产平台,这一点从最新公布的成绩单中也可以得到验证:
凝聚406万开发者,创建47.6万个模型,服务15.7万家企事业单位,中国深度学习平台综合市场份额第一。
今天,飞桨开源框架也正式更新到2.2版本。
这次飞桨升级的方向正是进一步加强融合创新,在开发、训练、部署全流程均有体现。
开发阶段,飞桨API更加丰富、高效、兼容;
尤其是体系化新增了科学计算API,新增短时傅里叶变换API、Jacobian/Hessian API和高阶自动微分等功能。
可支持计算流体力学、分子动力学等更广泛的模型开发,属于跨学科、跨场景的融合创新。
像这样的API,飞桨2.2版本新增了100多个。
训练阶段 ,全新发布端到端自适应大规模分布式训练技术。
4天前百度刚刚发布的全球首个知识增强千亿大模型鹏城-百度·文心,就是基于这项技术训练出来。
端到端自适应,说的是把不同模型和硬件抽象成统一的分布式计算视图和资源视图,属于软件与硬件的融合创新。为了进一步提高训练的稳定性和资源利用率,飞桨还提供弹性调度模块,能感知硬件资源变化,来自动重构资源视图,触发各个模块自动的发生变化。
部署阶段,硬件适配是让AI开发者最头疼的问题,这次飞桨自研了3个硬件接入优化方案:
Kernel Primitive API通过对算子计算与硬件的解耦,让开发者能更加专注于实现计算逻辑本身,同时做到一处优化可让70多个算子同时受益。
NNAdapter统一适配层实现了实现了算子定义及框架调度执行与硬件解耦,不仅降低框架和硬件适配的稳定性,还降低了代码的维护成本。
神经网络编译器CINN (Compiler Infrastructure for Neural Networks),编利用基础算子自动融合优化实现复杂算子功能,降低适配成本的同时,优化性能。
除了以上这些通用场景的技术升级,飞桨框架2.2还特别对文本任务做了从文本处理、训练、解码到部署的全面加速。
如果说技术上的融合创新是在降低门槛上迈出的第一步,那么工具上的融合创新能让飞桨技术更广泛的落地。
飞桨企业版升级带来了自动高效的模型部署功能。
在推理性能方面,启用了PaddleSlim根据不同模型和硬件的特点自动选择最佳压缩路径,在常见模型硬件上做到精度损失控制在1%以内,性能提升3-5倍。
在推理芯片的适配上,飞桨平台已完成9345种模型芯片的组合的真实测试和调优,可以覆盖95%的需求场景,节省97%的适配和开发时间。
在智能边缘控制台上,你可以直接看到以上模型服务的部署和管理,对输入设备、服务、事件进行实时监控管理。
另外还有一个“彩蛋”——零门槛AI开发平台飞桨EasyDL现在有了桌面版,一键极速安装,本地高效建模。
这次一起获得升级的还有飞桨产业级开源模型库。
百度结合场景的需求痛点,推出13个结合场景应用深度优化过的PP系列模型,实现精度和性能的平衡。
到目前为止,飞桨产业级开源模型库已支持超过400个模型,涵盖CV、NLP、推荐系统、语音等多种方向。
那么这些产业级的开源模型都用在了哪里呢?
已经用在了你身边
这样的技术,其实离我们的生活并不遥远。
例如上海哲元科技发展有限公司在制造业上有着多年的经验,在数字化大浪潮之下,选择采用百度飞桨的EasyDL来提高效率。
具体而言,他们基于飞桨EasyDL训练出食品生产流水线数量清点及外观检测模型。
这样就能够做到从蛋卷皮外观、巧克力喷涂、灌料、撒料、压盖、包装全流程智能化检测。
值得一提的是,今年9月,在上海哲元提供的智能化质检系统加持下,该冰淇淋品牌位于江苏太仓的工厂被认证为世界级“灯塔工厂”,更是全球冰淇淋行业的第一家“灯塔工厂”。
而之所以他们选择EasyDL,易上手和精度高是主要的原因。
公司2名研发从接触EasyDL到训练完成所需要的模型并实际应用仅花费二十多个工时,同时模型还可根据客户需求灵活迭代优化,快捷方便。
再如华夏天信机器人公司,专注于工矿企业智能硬件设备的研发、生产和实施。
而在中国近万座矿山的生产环节中,输煤用带式输送机是一种重要的煤炭运输设备,矿区用量可达十几台至上百台不等,是整体产业链中重要的一环。
但以往对此的监控方式都采用的是人工,包括巡检和安装固定摄像头等等。
这就非常的耗时耗力,以巡检为例,一天频率为2到3次,有时2人每组,重要的皮带设备还需6人实施3班倒。
而现在,华夏天信基于飞桨的目标检测工具套件PaddleDetection,开发出的输煤胶带智能巡检机器人。
如此一来,不仅能实现高频次、无间歇巡检,还能通过摄像仪将实时视频回传并智能识别分析。
可以说是一次性解决了工作效率、恶劣环境、作业安全等多项难题。
为了更好助推AI产业应用落地,飞桨此次还推出业界首个产业实践范例库,从真实产业场景分析、完整代码实现,到详细过程解析,直达项目落地,覆盖数十个高频应用场景,推动AI落地可复制和规模化。
而对于百度飞桨来说,技术本身和产业应用固然重要,但还有一点也是百度要“狠抓”的。
这就是开发者和生态。
越发热闹的飞桨社区
在生态方面,百度飞桨这一次升级了“大航海”计划,正式迈入2.0时代。
具体而言,就是在原有的启航、护航、领航三大航道基础上,新增“共创”计划。
启航计划是飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI师资,联合培养50万AI学子。
护航计划面向产业智能化。要达到的是智能升级,通过技术赋能、市场推广和资源导入,缩短技术创新到商业落地的路径。
而领航计划的面向群体,则是核心开发者,目标是与社区开发者一起共建开源生态,并探索前沿技术。
而此次新增的“共创”板块,可以分三个方向来看:
- 联合社区开发者:共创工具、模型、产业实践经验
- 形成产业创新需求对接平台:共创产学研用融合正循环
- 建设人工智能产业赋能中心:共创区域创新生态
至于其背后的缘由,吴甜解释道:
建设飞桨需要抓住的关键点有三个,技术持续创新、功能体验以开发者的需求为首位,以及广泛地与生态共享、共创。
那么在“大航海”计划的加持之下,百度飞桨的开发者都得到哪些益处?
在活动现场中,来自哈尔滨工业大学大三的学生曹志浩便分享了他的故事。
他从大一开始就接触飞桨AI Studio学习与实训社区,一路上已经是三载时光。
而在最初身为小白的他,最头疼的便是不知如何入手,很难找到实践的方法。
也花费过时间、精力在市面上的产品中“货比三家”,还自掏腰包买算力。
但当曹志浩接触飞桨开发者社区之后,这些问题便全部迎刃而解、烟消云散了:
飞桨平台上面有着非常丰富的一些学习资源和开发环境,帮助我的一些数理基础打得更扎实或者一些进阶的都可以在里面找到。
还有一些产品级的应用、前沿的模型,包括算力开发的流程都会在上面有所展现。
我可以在飞桨AI Studio社区上面开源一些代码,包括在上面也开源了一些3D点云的算法和基础原理的实现,还有一些趣味性的项目和实用性的项目,比如APP的开发。
不仅如此,曹志浩还认为在这条路上进阶过程“不是一个人”,他在开发者社区里遇到了许多志同道合的小伙伴。
他们分享读论文的经验、交流困惑,还组建团队共同“打怪升级”,并肩作战开源的3D点云模型仓库,支持一系列算法。
曹志浩分享的故事,只是众多飞桨开发者中的一例。
而类似的故事在持续不断地谱写着:
铁路工人在工作之余自学AI,基于飞桨实现了铁路货运车号的自动识别,为所在铁路段节省数十万元成本。
吉林大学的师生团队联合飞桨,打造了已在生产线上应用的药瓶自动化检测系统,并沉淀为教学课程,帮助更多师生学习AI技术和应用。
……
那么最后一个问题便是,百度飞桨为什么如此重视开发者和生态呢?
人才人才,还是人才
无论是技术发展、产业升级还是社区建设,归根结底都要靠人来实现。
随着AI与产业的深度融合,需要越来越多既懂AI,又具备产业经验的复合型AI人才。
百度飞桨在AI人才的培养上积累已久。面向高校,飞桨积极践行的是“产教融合”的路径:合作人工智能相关教材、提供人工智能教育资源,超过700所高校的3000多名AI专业教师从飞桨举办的深度学习师资培训中受益,百余所高校的学生基于飞桨开发创意项目、参与各类AI技术竞赛。
更深一步,则是探索产教融合协同育人路径。
如吉林大学三创实验室(创意、创新、创业)团队针对医药企业药瓶缺陷检测场景需求,基于飞桨平台创新研发了一套全方位、高精度的自动化检测系统,并实现了产线落地。
吉林大学还与飞桨共建了CV及AI+质检课程体系,将课程资源全面开放,通过飞桨学习与实训社区AI Studio,将这一实践经验输送给百万开发者。
面向产业,在复合型人才的培养上,深度学习技术及应用国家工程实验室与百度联合发起创办了首席AI架构师培养计划 (AICA)。
首席AI架构师培养计划目前已举办到第5期,累计向业界输送190名AI架构师,遍布工业、农业、金融、交通、能源等数十个行业。
吴甜从中观察到,每期学员们提出的课题,越来越深入到行业的关键问题,专业度逐年提升。
纵观整场Wave Summit+峰会,百度飞桨在产业、开源、人才培养方面下了这么大功夫,为什么?
答案依旧是王海峰在开场提到的融合创新与降低门槛的大趋势。
除了多种技术之间、技术与场景的融合,产业界、学术界、AI企业和开源平台之间也在进行更广泛的融合。
随着AI落地在更多如金融、医疗、制造、能源,乃至文娱体育这样的传统行业,不断降低技术门槛,打通产学研用形成正向循环,就成了人工智能发展的关键。
其根本目的还是更好地让技术本身和产业发展相结合,不断为经济发展注入新的活力,促进产业升级和智能化转型。
于是我们看到了由飞桨框架2.2新版本、飞桨产业级开源模型库、大航海2.0共创计划等项目共同组成的这份给开发者的“双12大礼包”。
在峰会现场,飞桨生态里的开发者们也把这一天过成了开发者的节日,许多人带着自己在飞桨平台上开发的作品来“练摊”。
像开头的机器狗在现场学习的新模型,就是一位个人开发者带来展示交流,被选中后登上主舞台的。
百度飞桨准备的这一份双12大礼包,你还满意么?
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾2024-12-14
- 罕见!云计算一哥CTO,现场不发产品只讲教训2024-12-06
- 清华系初创面壁智能获新一轮数亿元融资2024-12-11
- 马斯克新文生图模型闪现!网友抢时间疯狂实测:人物生成超逼真,可算把赛博皮卡画明白了2024-12-09