渐进派破壁：西有特斯拉，东有毫末智行！用数据智能推动自动驾驶历史进城

雷刚 2022-09-21 10:09:04 来源：量子位

“辅助驾驶更快赢得自动驾驶终局”

雷刚发自副驾寺

量子位 | 公众号 QbitAI

不争了。

辅助驾驶是通向自动驾驶的必由之路，渐进式路线更快赢得终局。

在创办的第1020天，在第六个HAOMO AI DAY现场，这种态度被亮得明确，结论讲得掷地有声。此时此地此身，在实践成果和趋势再清晰不过的情况下，多年的自动驾驶路线之争，已再无争论的必要。

特斯拉开创的路线，国外以FSD公测开始上路，国内则被速度更快的面壁者推向了检验时刻，而且是一个更大的数据闭环模型启动时刻。

这个在中国直道超车的面壁者就是毫末智行，现在还旗帜鲜明把行业公理真谛打上公屏：遵循数据智能，依靠数据智能，实践数据智能，这是驱动自动驾驶驶入终局的第一性原理。

并且随着自动驾驶相关的软硬件进入量产期，行业的探索来到了规模化进城时刻——新的分水岭，同样再清晰不过。

整个自动驾驶，将进入以数据智能驱动的3.0时代。

大道至简，方法论清晰，自动驾驶已无壁可面。

实践成果是展现真理的唯一标准

毫末智行的面壁成果是通过实践成绩展现的。

自创办以来，毫末智行刚度过了第1000天，却已经快速坐稳了中国量产自动驾驶第一名。

量产自动驾驶，对应的是无人驾驶，指的是把自动驾驶能力应用于量产车落地的实践。

在乘用车领域，毫末智行在短短2年多的时间内，从无到有推出了三代乘用车辅助驾驶产品HPilot，两年6次OTA升级，实现搭载超过十款乘用车型量产落地，同时并行30个项目异步开发。

包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等在内的上市车型，均已完成上车搭载。此外摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等则正在陆续交付。

于是截至2022年9月，毫末用户辅助驾驶行驶里程突破1700万公里，在中国量产自动驾驶阵营坐稳第一名。

并且这只是规模化落地的开始，毫末智行方面称，到2022年底，HPilot预计搭载车型近30款，未来搭载车型达到百万量级。

同时自动驾驶历史进城号角，也已经被吹响。

就在成都车展上，魏牌宣布搭载毫末智行城市NOH的全新摩卡DHT-PHEV激光雷达版，9月计划量产，年内发售，上市即交付。

城市NOH（Navigation On HPilot），正是毫末HPilot3.0的核心主打功能，计划让乘用车实现城市开放路况下的端到端智能驾驶。

而一旦交付，也意味着将毫末城市NOH将成为中国第一个大规模量产的城市导航辅助驾驶，将再次刷新量产自动驾驶乃至整个中国自动驾驶赛道的纪录。

在现场，产学研大牛对毫末速度、模式和成绩，不仅表达了一致的认可，还认为毫末所代表的是自动驾驶产业化落地的前进方向。

中国工程院院士、清华大学教授、清华大学智能产业研究院（AIR）院长张亚勤说，毫末成立1000天取得的成就令人瞩目，而且坚持举办的HAOMO AI DAY也是国内非常难得的聚焦AI自动驾驶的技术盛宴，搭建起了一个行业技术交流平台。

阿里巴巴集团副总裁、知名AI框架大牛贾扬清，则认为毫末正在自动驾驶领域推动新的AI技术工程范式，特别是数据智能体系和自动驾驶超算打造，或许会成为全行业内都有影响力的体系。

知名AI芯片公司寒武纪创始人陈天石，分享了云端和车端正在展现的计算需求和趋势，认为毫末的速度，站在了趋势一方。

△毫末智行“天团”：董事长张凯（左二）、CEO顾维灏（右二）、COO侯军（左一）、CIO甄龙豹（右一）

所以毫末速度的秘诀是什么？董事长张凯这次开门见山给出了结论性答案——

坚定地走渐进式发展路线。在自动驾驶的3.0时代，辅助驾驶是通向自动驾驶的必由之路。

张凯表示，目前中国已成为全球智能汽车主战场，预计到2025年，高阶辅助驾驶搭载率可达70%，智能驾驶的时代风口，避无可避。

之所以确认辅助驾驶是通向自动驾驶的必由之路，是因为数据驱动在其中的核心作用。

张凯强调，渐进式路线是数据积累的最佳路径越来越被行业所公认，成为自动驾驶公司的普遍发展方向。

毫末模式、毫末速度，就是对于渐进式路线的坚定实践的结果，也是自动驾驶行业最快1000天的速度之源。

接下来的问题是如何加速、且可持续？

Attention大模型加速自动驾驶终局？

靠MANA（雪湖），毫末自研建立的国内首个自动驾驶数据智能体系。

其中包含了数据获取、传输、感知、计算、验证等多个子模块，可以实现数据从输入到输出的迭代闭环，这也是毫末可以快速迭代、持续加速的保障。

在HAOMO AI DAY上，毫末披露了MANA的最新数据，截至2022年9月，MANA学习时长超过31万小时，虚拟驾龄相当于人类司机4万年。

毫末智行CEO顾维灏，还揭秘了MANA如何持续进化的秘诀。

一是来自产品和落地挑战的作用力。二则是不断吸收最前沿创新技术。比如在城市场景的落地中，就存在着4类场景难题、6大技术挑战。

其中场景难题主要包括“城市道路养护频繁”、“大型车辆密集”、“变道空间狭窄”、“城市环境多样”等。

与之相对应会产生6大技术挑战：

如何在自动驾驶领域应用大模型？如何让数据发挥更大的价值？如何使用重感知技术解决现实空间理解问题？如何使用人类世界的交互接口？如何让仿真更真？如何让自动驾驶系统运动起来更像人？

在4大场景6大挑战之下，毫末智行对MANA的感知智能和认知智能都进行了针对性升级调整。

首先，数据标注。通过使用大规模量产车无标注数据的自监督学习方法，可以实现模型效果的有效提升，相比只用少量标注样本训练，训练效果提升3倍以上，可以更高效完成训练，更好适应感知需求。

其次，增量式数据学习方法。针对新增数据，抽取部分训练数据构成混合数据集，而不是新旧数据区别对外的方法，更追求新数据的拟合和新模型对齐旧模型的输出，这样能让整体算力节省80%，响应速度提升6倍，也能避免量产车规模化产生数据后，无法兼顾规模和效率。

第三，重感知轻地图，告别高精度地图依赖。通过用时序的Transformer模型在BEV空间上做了虚拟实时建图，使得感知车道线的输出更加准确和稳定，让城市导航辅助驾驶不必依赖高精度地图——这实际也是更快更低门槛落地城市导航辅助驾驶的必备能力。

第四，车辆信号灯识别。通过车端感知系统升级，对车辆刹车灯、转向灯状态进行专门识别，让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。

第五，仿真系统进化。针对城市最复杂场景——路口，在仿真系统中引入高价值的真实交通流场景，与阿里云、德清政府合作，将路口这一城市最复杂场景引入仿真引擎，构建自动驾驶场景库，通过自动驾驶的真实仿真验证，时效性更高、微观交通流更真实，效破解了城市路口通过“老大难”问题。

值得注意的事，这是中国首个基于车路协同云服务的大规模自动驾驶场景库，也是中国第一个使用交通数据生成的自动驾驶场景库，对外发布和应用，也标志着中国自动驾驶来到了新阶段。

最后，拟人化认知。面对城市路况，如何让驾驶决策更像人类是公认的体验难题。毫末的方法则是通过对覆盖全国的海量人类驾驶进行深度理解，学习常识和动作拟人化，让系统能够结合实际情况选择最优路线保证安全，体感上也更像老司机。

以上，就是毫末在系统量产上车之后，获得的数据和场景的反馈作用力。

而在另一端，毫末延续本色，把AI最前沿创新技术的吸收作为进步的另一重保证。

现如今，大模型和Transformer落地应用自动驾驶已是业内所有玩家的共识，但熟悉行业前情的人或许多少还有印象，最早把Transformer作为新手段用于感知的，正是毫末。

最新前沿判断方面，顾维灏此次特别强调了Attention机制下的大模型带来的惊喜。

Attention大模型背后的机制，主要是用统一模型的思路解决问题，告别不同AI任务使用专门模型的范式。这种机制其实早在2014年便已经提出，但主要在NLP领域被应用，直到2020年起在计算机视觉领域也取得明显突破，从谷歌的VIT到微软的SwinTransformer，轻松刷爆各大排行榜。

基于Attention机制的Transformer结构，更是在各种通用任务中表现惊人，展现出有效的通用AI模型范式的潜力。

而且Attention机制结构简洁，可以无限堆叠基本单元得到巨大参数量模型，随着参数提升效果也在提升。

顾维灏认为，基于Attention大模型，辅助驾驶获得的大规模人机共驾数据就有了更高效地转换，随着量产车交付和上路，数据量不仅大而且足够多样，就能更快抵达自动驾驶终局。

这也是毫末认为“辅助驾驶是通往自动驾驶的必由之路”的技术底层自信，现阶段没有比辅助驾驶能更高效地积累到足够规模和多样性的数据。

但欲享Attention大模型之利，就得解决其落地之不易。

最核心的就是超大参数对于算力的需求：高需求、高成本，高落地难度，让摩尔定律不再有效。

顾维灏透露，毫末的方法是通过低碳超算来降低训练成本，通过改进车端模型和芯片设计来实现车端落地。云端和终端两头并举，两头优化。

于是毫末超算中心也正式亮相，成为首个构建超算的自动驾驶公司。

毫末方面还透露，毫末超算中心的目标是满足千亿参数大模型，训练数据规模100万clips，整体训练成本降低200倍。

自动驾驶的3.0时代？

量产、规模化、数据智能……

这是毫末智行谈到最多的词、强调最多的词，也是对于自动驾驶发展阶段的最新认知的总结。

在自动驾驶的落地探索征程中，有过路线的划分，比如Waymo为代表的终极派和特斯拉为代表的渐进派；有过传感器的阵营，如激光雷达阵营和纯视觉阵营；甚至以商用模式为基准，还有To C、To B和To G的划分。

但如果从第一性原理出发，有没有大一统的标准和审视？

毫末智行认为：有，而且只有一个标准：数据。

按照数据的规模，也能把自动驾驶探索大道至简划归为三个时代：

1.0时代，硬件驱动为主，规模历程在100万公里左右，主要感知方式是激光雷达，认知则依赖人工规则。

2.0时代，软件驱动开始发挥作用，规模可以累积到1亿公里，感知开始融合，但依然是不同传感器单独输出的结果，认知方面依然人工规则占主导，开始用小规模小数据实现更好的预测和规划。

3.0时代，数据驱动为核心，硬件和软件在这里实现了大一统，感知也实现了多模态传感器联合输出的大一统，认知上可以实现依靠大模型大数据拥有可解释的场景化驾驶常识，能够驱动1亿公里以上的数据迭代。

实际上，按照毫末提出的三个时代划分，不仅很多过去的自动驾驶现象能得到解释，比如1.0时代堆砌了激光雷达的Robotaxi为何还会有低级事故，又比如2.0时代量产车上的高速环路导航辅助驾驶产品的体验差异……以及特斯拉AutoPilot和FSD的体验确实在日拱一卒、不断得到优化。

所以更重要的是，毫末提出的这种数据维度的划分，真正能让自动驾驶流派和演进万佛朝宗，业内和业外，都可以有更加客观的坐标和参考。

以前，衡量自动驾驶的技术发展水平，有过VC认可的维度，有过自报MPI的维度，有过体感体验的维度，也有过路测牌照的维度……

但无一例外都是偏向主观的维度。

只有量产基础下的数据维度，才接近AI跃迁的原理，才是更加客观的维度。

而且这也是自动驾驶第一阶段竞速的结果，也是量产落地被作为自动驾驶中场哨的原因。

有意思的是，随着数据智能的自动驾驶3.0提出，自动驾驶领域已然无壁可面。无论哪一路线，无论哪个阵营，最核心的竞争力都已经被放在了明面上——

有多大规模的数据？有多高效率的数据获取、训练和利用的能力？

这关乎迭代速度，也关于能耗、成本和赢得终局的加速度。

数据智能的能力，就是衡量自动驾驶公司核心壁垒的指标。

数据智能的能力，就是自动驾驶新阶段的分水岭。

其实这种分水岭效应，之前已经在更受关注的路线之争中展现。

特斯拉的价值，在产能问题被上海解决后得到了完全认可，股价和市值一飞冲天，马斯克个人登顶地球首富，AutoPilot和FSD技术能力越来越强……而且随着量产车上路越多，获取数据的规模越大场景越丰富，这种能力迭代和进化就还会持续。

作为对应，这波自动驾驶浪潮的开创者Waymo，估值却被一而再下调，落地和推进速度一而再delay，获取数据的规模和多元性——没能展现出更大的增长趋势。

不过，上述已经展现的这种分水岭效应，之前更多被作为特斯拉和Waymo的“私人恩怨”看待，遮盖了背后反应出的本质问题。

现在，摸着特斯拉过河的毫末智行，在敢于天下后的实践成果基础上，把渐进式、辅助驾驶更快赢得自动驾驶终局的道理喊得响亮，并且用自动驾驶3.0的判别式，验证自动驾驶公理下的新定律。

这代表着自动驾驶的终局之战已经拉开了帷幕，也意味着整个自动驾驶江湖，又到了重新洗牌、重估位次的时候。

至少，是时候提出这个问题了。

— 完—

无人车往哪里开智能车真high 毫末智行特斯拉

雷刚

渐进派破壁：西有特斯拉，东有毫末智行！用数据智能推动自动驾驶历史进城

相关阅读

特斯拉拟为Model 3安装噪音机，通过发声提醒行人

石油土豪79亿投资蔚来，腾讯从中套现26亿

特斯拉自动驾驶新能力：识别红绿灯停车标识；尝鲜车主：实用好用

图森完成国内首次自动驾驶重卡在公开道路的全无人化测试

都2023年了还有人创业做数据标注？还有VC和大厂看好？？

特斯拉即将交付后轮驱动长续航版Model Y，4个版本将全部交付

热门文章

AI应用突围，中小企业的新周期已至

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器

阿里云造“Agent工厂”，百炼MCP服务上线，无需代码5分钟建Agent

倒计时1周！20余位行业大佬共话AI，中国AIGC产业峰会最全攻略在此