「深度学习+」阶段来了！百度王海峰：深度学习多维度逐渐成熟，创新创造大有可为

十三 2023-01-10 23:32:42 来源：量子位

以「深度学习+」驶向AI工业大生产

允中发自凹非寺

量子位| 公众号 QbitAI

人工智能的技术创新和产业发展，进入“深度学习+”阶段。

这是来自百度CTO王海峰的最新判断。

没错，不是很多人已熟知的“人工智能+”或是“智能+”。

而是把范围直接缩小到了它们的子集：深度学习。

有何区别？

类似于此前更早的“互联网+交通”催生打车软件、网上购票改变人们出行的方式，符号的前后二者绝不是简单的求和关系，而是需要它们进行深度融合。

而人工智能技术，在当今被普遍视为第四次工业革命的核心驱动力；因此，作为人工智能关键核心的深度学习该如何做“+”法，我们不妨以史为鉴，通过前三次科技革命的发展进程来窥其一二。

众所周知，每一次的科技革命都拥有一个核心驱动力般的技术存在，它们分别是机械技术、电气技术和信息技术，而其共性便是都具有很强的通用性。

在三个科技革命步入到“大生产”阶段之际，这些核心技术在扎根行业的同时，类似于作用力与反作用力，行业本身也在发生着质的变化。

一方面是在这些技术加持下的行业逐步成为社会基础设施般的存在；另一方面，随着这些行业的不断发展，还催生出了更多新技术和新行业。

再具体一些，以第二次科技革命的电气技术为例，技术本身从发电机发展到大规模发电、架设电力网络、研制各种输变电设备等，于是乎，电力的产业链便形成了。

不止于自身的发展，在电气技术与其他传统科学做“+”法时，还衍生出了电化学、电物理、电生物学等新的研究领域。

由此更进一步地使后来的电子、通信等新型技术行业得以兴起。

如此总结来看，每一次科技革命，都需要这样一个驱动力般的核心技术做“+”法来彻底改变社会的发展。

而站在现今这一时间节点，王海峰则认为，当前规模化的AI大生产已然形成，深度学习从技术、生态、产业等多个维度逐渐成熟，人工智能的技术创新和产业发展，进入“深度学习+”阶段，让创新创造大有可为。

王海峰还给出了这样的一个评价：

“深度学习+”是创新发展新引擎，驱动技术发展和产业增长，让创新创造大有可为。

那么作为国内第一批且深耕深度学习十余载的百度，到底对“深度学习+”拥有的是怎样的一种思考和理解？

“深度学习+”，要“+”什么？

区别于前三次科技革命，第四次科技革命所涉及的驱动力技术还是有较大区别的。

因为人工智能本身就是一个具备交叉性的技术，所以它要从一个技术演进成为基础设施，再去影响千行百业，“+”法显得更为重要。

而作为人工智能技术的核心，深度学习也是沿袭了上述特性。那么“深度学习+”又该如何实现“+”法呢？我们逐层拆解来看。

首先是“深度学习+知识”，这是从技术角度出发所给出的一个“+”法。

这里的知识，所指的是凝炼了人类认识和改造世界的智慧。

如此结合之后，机器便不再是像以往简单地被投喂大量数据来训练学习，而是要把大量知识也融入进来。

一个非常典型且符合这种“+”法的案例，便是百度自研的产业级知识增强大模型——文心。

如此做法之下结果，用王海峰的话来说就是：

知识增强的深度学习，效果更好，效率更高，有更好的可解释性。

换言之，在第一层“+”法加持之下，人工智能技术不仅能够凭借海量知识演绎“通才”般的角色，放之各行各业，也是具备“专才”的能力。

而“深度学习+”的第二个维度是从生态角度出发，所要连接的是“上下游生态伙伴”。

这是因为深度学习要把它的实力发挥到极致，光是靠模型算法层的单打独斗是远远不够的。

放眼人工智能发展历史，在提高效率这件事上也亦是如此，单凭算法的加成毕竟具备局限性。

因此，“深度学习+”的第二个“+”法，就是要把芯片、框架、模型及应用都融合进来，一起构成一个深度学习的良性生态。

例如芯片在这个“+”法中承担提供强大算力的责任，以此来支持纷繁多样的深度学习训练、推理；框架则可以比作是操作系统，让开发、训练、推理、部署等工作的效率大幅提升。

多样的模型和开发套件，则让开发者如虎添翼，甚至可以把开发变得开箱即用那么简单；至于良好的应用，就可以让深度学习技术与场景融合创新，加速传统产业转型升级，催生新业态新模式。

至于“+”法的最后一层维度，则是从产业角度出发所提出的“深度学习+千行百业”。

正所谓“实践是检验真理的唯一标准”，以交通领域里的智能调度系统为例，便是“深度学习+交通”的一个实践产物。

在这套系统的加持之下，现如今的北京、湖南的株洲、长沙，河北保定、重庆永川、广州黄埔等城市，都在开始享受“绿灯自由”的畅快。

再如通过“深度学习+制造业”、“深度学习+服务业”、“深度学习+保险业”等精准的产业“+”法，更是让千行百业真正地做到了深度学习所带来的降本增效。

这便是“深度学习+”在做深入融合时所需联结的三大维度。

但之所以说要聚焦这三大维度并非是空穴来风，实则从全球科技国际巨头玩家的做法中也是有迹可循。

以“深度学习+知识”为例，如谷歌、Meta、微软等，也正在遵循一条将深度学习技术和知识做融合的路径，各自提出了更具通用性的大模型。

再到“+上下游生态伙伴”这层，在TensorFlow、PyTorch等框架的基础之上，互联网起家的科技公司们，不仅上探做应用，也在不断往底层寻求硬件的适配，以构建全要素深度学习技术基础设施的方式，让深度学习技术的开发变得更加丝滑，也更加低门槛。

而后它们将这些技术输送到了千行百业，造就了大火的ChatGPT、基于diffusion模型的各种绘画AI等。

如此情形，也就是王海峰所说：

深度学习平台的标准化、自动化和模块化特征越来越显著，不断降低人工智能的应用门槛，高效便捷地把人工智能技术输送给千行百业，规模化的AI大生产已然形成。

这也正是人工智能的技术创新和产业发展，进入“深度学习+”阶段背后的原因了。

“深度学习+”背后：百度已蓄势十余载

不难看出，“深度学习+”实际上是行业所向，技术所趋。但为什么是百度，率先提出了这一观点？

一方面，百度作为中国AI的头号玩家，有着充足的技术积累：

自研深度学习框架平台和大模型贯通了硬件适配、模型训练、推理部署，到场景应用的全产业链，已经为人工智能技术创新和产业增长夯实了智能化基座。

具体来说，基于多年以上的深度学习技术研究和产业时间，百度打造了集核心框架、产业级模型库、开发套件、工具组件和服务平台于一体的飞桨深度学习平台。

目前，飞桨平台已经凝聚535万开发者，服务20万家企事业单位，创建了67万个模型。

在此基础之上，百度文心大模型不仅能解决NLP、CV、语音等多模态问题，还能与产业知识深度结合，调优为行业大模型，进一步打通深度学习产业化的路径。

另一方面，百度在技术上的前瞻性判断，在某种程度上已经形成“传统”，并已被多次验证。

比如，在深度学习领域，百度就是最早躬身入局的中国科技公司之一。

2012年，在深度学习方兴未艾之时，百度便已经开始着手探索深度学习技术，并于次年在全球首个成立专注深度学习研究的深度学习研究院（IDL）。

在框架与平台方面，2020年，国内兴起自研深度学习框架热潮。但早在热度爆发的4年前，即2016年，百度就对外开源了PaddlePaddle（百度飞桨）。

根据IDC报告，截至2021年上半年，TensorFLow、PyTorch以及百度飞桨成为国内最高频使用的开源框架。

2017年，国家发改委还正式批复，由百度牵头筹建深度学习技术及应用国家工程实验室。

这也是业内首个、目前唯一的深度学习领域国家工程实验室（现在已经升级为国家工程研究中心）。

用“深度学习国家队”来形容百度也并不为过。

值得一提的是，在技术上甘坐冷板凳坚持投入的同时，百度还不断尝试着技术与产业更深度的结合。

这也为“深度学习+”阶段到来之际，引领技术创新和产业增长奠定了丰富的产业实践基础。

比如，在交通领域，百度就帮助程度国铁电气设备有限公司，基于飞桨研发了一套“轨道在线智能巡检系统”，实现了对轨道巡检图片的实时检测。

该系统可同时安装到工程作业车和运营电客车上，能够在不影响电客车正常行驶的情况下，全天候对轨道缺陷实施智能判断，目前已在深圳地铁的相关线路上试运行。

板凳甘坐十年冷，也正是多年的技术蓄势，使得百度在规模化的AI大生产时代，在“深度学习+”来临之际，敢于率先做出判断，并坚定不移地朝向这个方向，做技术创新、打通产业路径的先锋。

而从更深远的影响来看，这种技术自立自强的底色，亦将成为我国经济社会高质量增长的助力。

后续如何，且待时间检验。

深度学习百度

十三

「深度学习+」阶段来了！百度王海峰：深度学习多维度逐渐成熟，创新创造大有可为

“深度学习+”，要“+”什么？

“深度学习+”背后：百度已蓄势十余载

相关阅读

不做Sora背后：百度的多模态路线是什么？

百度新晋副总裁景鲲：智能音箱补贴没有停止时间表，今年拿下全年国内第一

企业开发者，如何迎来编程自动化的时代？｜对话百度孙珂

百度无代码开发工具“秒哒”正式开启用户邀测

百度DuerOS负责人景鲲晋升副总裁，继续向李彦宏汇报

百度发布iRAG，李彦宏：AI行业最大变化是大模型基本消除幻觉

热门文章

一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模型成本降了6成？！

百度Create大会文心智能体论坛：开放生态驱动AI杀手级应用落地

7×24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

数学家们仍在追赶天才拉马努金

宝马秀起汽车科技来，哪有其他汽车什么事…