华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

盘古大模型5.0,重塑自动驾驶

一凡 发自 副驾寺

智能车参考 | 公众号 AI4Auto

精锐尽出,华为杀疯了。

华为开发者大会2024 (以下简称HDC 2024)震撼开幕,“纯血”鸿蒙、盘古大模型5.0、编程语言仓颉、5.5G……新成果接连炸场。

科技春晚全程高能,技术盛宴干货满满。

尤其是盘古大模型对自动驾驶的变革,引发行业关注。

AI生成视频如此逼真,自动驾驶不必依赖路测。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

华为盘古大模型,重塑自动驾驶

在HDC 2024上,华为官宣盘古大模型升级至5.0,多模态能力大幅提高。

所谓多模态,即盘古大模型5.0能更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外和遥感等更多模态,生成的内容更符合现实规律。

从应用落地来说,聚焦自动驾驶行业,盘古大模型5.0将支持灵活定制,生成不同路况、不同光照、不同天气的训练视频数据,时长最长可达1分钟

在现场,华为还对这项能力进行了演示:

可以灵活定制,是要生成一条空的街道,还是多车复杂路况:

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

天气情况也能上上强度:

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

仔细观察,会发现当天气变化时,生成的车辆细节不一样:

同一辆车,雨天时车灯是打开的。

如何做到这么逼真且智能的?

背后是创新的可控时空生成技术(STGC),核心是数据模型两个方面。

训练数据,华为采用六个视角相机,覆盖360度,累计采集和治理20万帧高质量数据。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

模型方面,华为在视频生成大模型VAEDiT架构的基础上,新增了三个输入模块

  • 3D边界框编码器(3D bounding box Encoder)
  • Bev路网编码器
  • 相机轨迹编码器

然后使用算法处理3D边界框和BEEV路网图,使得盘古大模型实现多视角关联学习,学习到多视角空间和时序一致性。,从而生成自动驾驶训练所需要的场景。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

这有助于解决当下自动驾驶的两个难题:

数据集的泛化边缘场景生成

自动驾驶系统的训练非常复杂,过去依赖路测,部署车队投入大,路测采集数据成本高,时间周期长。

同时自动驾驶的能力成长,受限于遇到的边缘场景(Corner Case),比较罕见。

而且遇到边缘场景,针对性调整系统后,也不一定能复现出来验证,毕竟路况车况随时在变。

而且极端地边缘场景,比较危险。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

对于这些问题,其实业内早前也提出过仿真测试的路线。

只不过过去是,先建模后渲染,构造仿真数据成本高,精度误差大。

现在,华为用盘古大模型,实现了建模仿真AI生成的转变。

有助于自动驾驶摆脱路测依赖,收集数据不一定非要上路,降低自动驾驶训练成本。

边缘场景可生成可复现,加快自动驾驶终局到来。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

此前WayveWaabi这类初创公司,就因相关能力受到关注,英伟达等巨头投资。

现在华为正式官宣入场,很可能会把这条赛道推向新高潮。

而自动驾驶,不过是盘古大模型重塑千行万业的冰山一角。

盘古大模型,也只是HDC 2024科技盛宴的其中一道主菜。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

HDC 2024,重塑、升级与跨越

除了自动驾驶,在现场华为还提及了盘古大模型对各行各业的赋能,包括工业设计、建筑设计、具身智能和汽车设计

华为还特别提到了,盘古大模型对新车造型设计的利好。

盘古大模型可以将原来需要1-2年设计周期大幅缩短,造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D数字模型。

还可进行风格化调整,以及零部件编辑,变换颜色等。

生成的数字模型还可以直接输出成3D文件,支持10几种主流格式。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

设计师可以直接3D打印样品,减少制作油泥模型的轮次,极大地节省成本和时间。

除此之外,其实很早以前,盘古大模型的视觉能力,就已经用来检测汽车零部件的缺陷了。

盘古大模型升级炸场,同样官宣升级的还有5G技术。

余承东在现场宣布,5.5G的时延更低,连接数更多,今年会是5.5G商用元年

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

在华为官方的预热视频中,最新机型Pura 70已经出现5.5G的网络标识,其中意味不言自明。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

还是接着聊新升级对智能车和自动驾驶的影响。

据公开报道,其实从去年,有车企比如长城,就已经在试验“5G-A(5.5G)超可靠低时延汽车柔性产线”,尝试提高生产效率。

而在自动驾驶领域,无人车每天产生的超海量数据,借助5.5G也能够实时传回后台算力平台,加快算法训练。

相比盘古大模型和5.5G,可能对于普通用户来说,最关注也是感受最直接的,还是“纯血鸿蒙”,也就是Harmony Next。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

新一代鸿蒙操作系统,不仅是内核、数据库和文件系统等等自主,还有配套的编译器、编程语言、开发IDE和框架。

从最底层的核心硬件,到用户交互的前端,每个开发环节实现自主,还有9亿台设备支撑的生态,动摇操作系统两强格局。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

不过在大会现场,谈到Harmony Next的升级,华为更多地还是介绍对终端的影响。

但也能从中推测到,未来的鸿蒙车机,流畅度还会继续提高,车机交互会有新的想象空间,

以及华为在自动驾驶的实践,反哺到终端了。

在大会上,余承东用L1-L5的概念,来形容划分“纯血”鸿蒙升级后,语音助手小艺的推理规划能力。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

他还在现场激动地表示:

今天,鸿蒙大势已定。

没有人能熄灭满天星光。

后一句话,余承东在4年前的华为开发者大会上就说过:

没有人能够熄灭满天星光,星星之火可以燎原。

华为重塑自动驾驶,纯血鸿蒙编程语言亮相,开发者大会杀疯了

如今我们看到,盘古大模型正重塑千行万业,5G技术持续升级,鸿蒙生态跨越式进化。

4年前的星火,真的已成燎原之势,汇成璀璨星河。

风雪倾轧四五年,轻舟已过万重山。

万重山后,继续领先。

版权所有,未经授权不得以任何形式转载及使用,违者必究。