用大模型“百度一下”,是种什么体验?
搜索+大模型的产品
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
百度最擅长、最知名的搜索,要“变味”了。
因为这一次,他们决定把大火的大模型也丢进去做成产品了。
这个大模型,就是百度自家的“最强兵器”——文心大模型。
AI大模型应用在搜索场景,带来的新产品则叫做文心百中。
好奇的小伙伴肯定要问了,那它跟我们传统搜索会有什么不同呢?
举个例子。
针对“山城是指的哪个城市”这个问题,传统基于关键词搜索的结果可能会是这样的:
(注:“相关度”采用ES默认计算方式,分值为0~1区间,分值越高说明模型认为结果越符合检索需求)
但很显然,传统搜索的结果并不是我们想要的那个答案。
而这个问题到了文心百中手里,得到的答案就通灵了:
(注:置信度由百中搜索模型计算得出,分值为0~1区间,分值越高说明模型认为结果越符合检索需求)
这只是文心百中在“知识搜索”里的能力展现,它对于开发者还制定了特定的搜索功能。
例如在“开发者搜索”里输个“Java”,会得到这样的结果:
可以说搜索的结果是相当垂直、相当“技术流”的那种了:清一色都是概念介绍、热门GitHub项目、官网介绍等。
但纵观文心百中所涵盖的其它领域,一个非常明显的特点就是很To B。
换言之,它的发力点不单是普通用户、开发者,还聚焦在了许多产业领域之中。
这一点,在近期WAVE SUMMIT+ 2022深度学习开发者峰会上百度对它的介绍不谋而合——大模型驱动的产业级搜索系统。
文心百中的特点可以总结为三点:“极简的系统”、“强大的语义理解”和“极低的人力成本”。
百度CTO、深度学习技术及应用国家工程研究中心主任王海峰还提到:
具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。
这也正是百度文心大模型产业化路径的一个缩影,而铺设这么一条路百度已有数载时间。
那么站在现在这个时间节点,大模型的产业之路,或者更广泛的来说是AI的产业化之路,都有啥新进展?
我们不妨一同来看下。
百度的大模型之路:越发亲民、易用
“亲民”、“易用”,是纵观整场WAVE SUMMIT后,对百度大模型最为直观的感受。
这里可以从两个方面来理解。
其中之一便是越发接地气,“文心一格”的能力升级便是很好的体现。
文心一格是百度今年8月推出的AI艺术与辅助创作平台,用户只需要往里面丢自然语言,就能生成风格多变的画作——
把“凤凰”相关的表述输入进去,再选择相应风格,就能得到下面这张恢弘绚丽的作品:
而这一次,百度把文心一格变得更加亲民、功能更加丰富。
例如可以“以图生图”,通过用户输入的图,可以生成按用户指定要求风格的一些新图。
还可以“文字编辑图片”,只需要简单描述下文字,就可以极简地对图片进行编辑。
不仅如此,还可以让图片一键生成视频。
这便是文心大模型“接地气”产品化的其中一面。
而另一面,则是在固有大模型的“根节点”基础上,以“产业级”、“知识增强”为路径,不断向下繁衍出更多“叶节点”——聚焦产业的大模型。
整体而言,这次文心大模型又发布了11个全新大模型:
- 5个基础大模型
- 1个任务大模型
- 5个行业大模型
五个新基础大模型
首先是在NLP大模型方面。
这次推出了知识增强轻量级大模型ERNIE 3.0 Tiny,它是以ERNIE 3.0千亿参数大模型为“教师”,通过多任务知识蒸馏手段,将“毕生所学”浓缩到了一个轻量级模型(10亿级、亿级和千万级)。
ERNIE 3.0 Tiny一大特点就是具备较强的泛化能力,相对于超大参数模型而言,推理速度提升数十倍到百倍,能够显著降低超大参数模型落地的成本。
跨模态方面,新增了3款大模型。
跨模态理解大模型ERNIE ViL 2.0,采用多视角对比学习方法,同时构建模态内部与模态之间的表示对齐,在中文、英文效果上均超越业界最优模型。
据了解,ERNIE-ViL 2.0已在飞桨企业版EasyDL上线,支持一站式的精调训练、推理,可用于多种图文匹配应用场景。
跨模态生成大模型ERNIE ViLG 2.0,属于知识增强的混合降噪专家模型。
它的训练过程引入了视觉知识和语言知识,可以提升模型跨模态语义理解能力与可控生成能力。
在扩散降噪过程中,ERNIE ViLG 2.0通过混合专家网络建模,增强了模型建模能力,提升了图像的生成质量。
文档智能大模型ERNIE-Layout,它是以文心多语言ERNIE为基础,融合了文本、图像、布局等信息进行跨模态联合建模,还引入了布局知识增强,提出阅读顺序预测、细粒度图文匹配等自监督预训练任务,并最大支持96种语言。
它所擅长且已应用的领域包括金融、保险、能源、物流、医疗等行业。
最后是在生物计算大模型上,推出了单序列蛋白质结构预测大模型HelixFold-Single,它是业界首个开源的、基于单序列语言模型建模的蛋白质结构预测大模型。
从近3亿的无标注蛋白质数据中提取信息,建模蛋白质之间的关系,从而将MSA同源信息隐式的学习在预训练大模型中,进而有效地替代MSA信息检索模块,使得模型推理速度提升数百倍。
从效果上来看,HelixFold-Single在抗体蛋白结构预测上比AlphaFold2更优,更有助于抗体药物的设计 。
一个新任务大模型
代码大模型ERNIE-Code,它是在海量代码和文本数据基础上进行预训练,采用多语言多代码联合学习。
由于ERNIE-Code基于中间语言的翻译语言模型,因此它还具备跨多种自然语言和编程语言的语义理解和生成能力。
据了解,ERNIE-Code在代码生成任务、代码搜索任务,多语言代码摘要和代码文档翻译等多个公开的评估基准上取得领先效果。
5个行业大模型
在此之前,文心行业大模型已经发布过6个,而这次,又有5位成员被涵盖了进来。
它们分别是:
- 深燃-百度·文心:知识增强的燃气行业大模型
- 吉利-百度·文心:知识增强的汽车行业大模型
- 泰康-百度·文心:知识增强的保险行业大模型
- TCL-百度·文心:知识增强的电子制造行业大模型
- 辞海-百度·文心:知识增强的社科行业大模型
……
除此之外,在工具与平台层面上,百度还将大模型的开发套件全面升级,开箱即可用的建模、定制、精调和可信学习工具。
再如飞桨企业版EasyDL零门槛AI开发平台和BML全功能AI开发平台,升级提供全流程开箱即用的大模型能力。
这就是此次百度在大模型上的最新动作,也是大模型应用的最新风向标。
不难看出的一点是,百度的文心大模型产业味道非常浓厚,它的“叶节点”正在向千行百业蔓延开来。
或许对于百度而言,大模型和行业大模型之间的关系,也展现出面向产业开放和赋能的一面。
好比武林至尊把自家的兵工厂、铸剑池,对外开放,帮助需要的任何产业方打造趁手兵器。
如果说文心大模型是百度自家打造的“独门宝剑”,完全是基于自身的武功、特点、需求打造的工具,主要为自己服务。
那么产业大模型,就是百度给产业各方提供了铸剑服务,帮助打造所需的工具,来自产业需求,用于产业痛点,而且产业方完全不需要掌握大模型这样的高门槛技术,借助百度就能完成符合自己需求的大模型。
而如此能力背后,还离不开大模型背后更为底层的一个东西,那便是深度学习平台飞桨。
在这次的WAVE SUMMIT中,飞桨同样也有了较大的升级。
飞桨升级2.4版本,“产业味”更重了
用王海峰的话来说,飞桨这个深度学习平台是基础共性平台,下接芯片,上承应用,相当于智能时代的操作系统。
其在AI技术应用、AI产业化进程中的重要性可见一斑。
而且飞桨作为一个深度学习平台,虽与文心大模型“异曲”,但从出发点和目标来看,却又有着“同工”之妙——加速AI的落地。
为此,时隔半年之后,飞桨已经步入到了2.4版本的阶段。
若是将这次的升级提炼出三个关键词,它们分别是技术、功能和生态。
首先是在技术方面的“三部曲”:
- 开发:新增稀疏计算、图学习API;升级高阶自动微分能力,支持科学计算应用;动态图转静态图技术升级,支持复杂模型导出和部署。
- 训练:业界首个同时支持复杂算法+超大图+超大离散模型的大规模图学习训练技术,单机即可支持百亿节点、数百亿边的采样和训练,并可通过多机扩展支持更大规模
- 部署:高扩展、自动化、高性能推理技术助力大模型应用;新发布AI部署工具FastDeploy。
这是在技术层面上的能力提升,也是飞桨每年在WAVE SUMMIT上必秀的一块肌肉。
其次是在功能体验方面,可以说是“产业味”越发浓郁。
例如飞桨这次发布了业界首个一站式开源大模型开发套件PaddleFleetX,可以全流程支撑大模型生产落地。
不仅如此,从百度透露出来的几组数据,也能够体现飞桨越发浓重的产业味:
- 产业级模型库开源低代码模型新增至600+个
- 产业级特色PP系列模型新增至42个
- 发布飞桨产业级模型库一站式入口
- 产业实践范例即产业落地全流程“样板间”新增至68个,覆盖金融、工业、交通、互联网等重点行业。
最后是生态建设方面,可以分为三个方面。
在产业生态上,飞桨已经联合了行业众多龙头企业,包括国家能源集团、中国工商银行、中国联通、中国石油、中国铁道科学研究院、中国移动、中国一汽,发布产业范例征集计划。
在硬件生态上,飞桨硬件生态共创计划”硬件伙伴由13家增至28家。
其中12家(包括英伟达、英特尔、昆仑芯、Arm、天数智芯、清微智能等)已经发布飞桨生态发行版,为开发者提供软硬一体化体验。
在人才生态上,“飞桨AIStudio人工智能学习与实训社区”新增了“企业实训”与“生态异构算力中心”。
二者同样是已经与国家电网、OPPO、英特尔、英伟达和曙光等龙头企业展开了合作。
……
由此可见,无论是大模型亦或是飞桨,它们现在所聚焦的内容无不在围绕着“产业”二字在展开。
那么接下来,就要回到最初我们提到的那个问题:
AI产业化之路,现在什么阶段了?
要回答这个问题,我们不妨先将四年来的Wave Summit铺开来看下。
在2019年第一届峰会中,王海峰就提到:
深度学习正在推动人工智能进入工业大生产阶段。
王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。
这种模式可以归结为“三化”,即标准化、自动化和规模化,这也就意味着人工智能在进入工业大生产阶段。
到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。
这也就迈出了通过预训练大模型来降低AI门槛的重要一步。
而在去年,百度集团副总裁吴甜在峰会中提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。
并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。
与此同时,在同年的12月份,文心大模型也随之正式亮相。
就在今年5月的峰会中,吴甜还提到“今年是大模型产业落地的关键年”,并给出了她认为的一种解法:
要做好落地,需要解决的关键问题是,前沿的大模型技术如何与真实场景的方方面面要求相匹配。
而到了今天这个时间节点,在AI产业化这条道路上,百度正在发出一个非常明显的信号——
框架、模型不仅要用起来,更重要是要打出去,用吴甜的话来说就是“生态太重要了”。
对于这一点其实并不难理解,正如历史中每一次的工业大革命,都是有通用技术的普及一样,例如机械技术、电气技术和信息技术。
而要做人工智能时代下的普及,就需要先让框架、大模型在企业,尤其是龙头企业铺展开来;而后通过反馈和优化,逐层向下更深入的应用起来。
这或许也是百度不遗余力降低AI技术使用门槛,并且把自家“最强兵工厂”对外营业,与产业众多企业强强联手的原因了。
那么在如此发力之下,AI产业化又走到了什么阶段?
或许借鉴更为大众所熟悉的移动通信发展史,可以更好得出结论。我们知道,智能手机之前,有过最初的大哥大、小灵通、功能机,最后才是我们所处的智能手机时代。
有人认为即将来到功能机,也有人认为一切才刚开始。
换个角度来说,历史性的一页才刚刚拉开序幕,广阔的产业化机遇才刚刚开始。就像瓦特完成蒸汽机改良时,没有人能意识到,会进入一个生产力大爆炸的新时代。
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾2024-12-14
- 罕见!云计算一哥CTO,现场不发产品只讲教训2024-12-06
- 清华系初创面壁智能获新一轮数亿元融资2024-12-11
- 马斯克新文生图模型闪现!网友抢时间疯狂实测:人物生成超逼真,可算把赛博皮卡画明白了2024-12-09