理想智驾王炸:车位到车位全程在线,还能自主过收闸机
“800万clips训练”
最新V13版本智能驾驶,落地中国!
不是期货FSD,而是理想刚刚推送的端到端智驾版本V13。
“车位到车位”、“无限接近0接管”、“800万Clips训练数据”…
2025开年,靠端到端跻身智驾第一梯队的理想,又率先提速了。
这个年,卷起来卷起来~
理想V13,有啥变化
和FSD重名只能说巧合了,理想透露说刚好这也是端到端迭代的第13个大版本,MAX车型今天刚刚推送,智驾版本号为AD Max V13.0。
整体硬件配置,包括2颗英伟达Orin X芯片,算力超500TOPS;1颗128线高分辨率激光雷达;6个800万像素高清摄像头和5个200万像素摄像头,以及5个毫米波雷达。
L9、8、7、6,以及MEGA的MAX版本全都相同。
正式推送之前,不少内测用户已经在理想用户社区上传了一手实测体验。
比如@皮特格雷的用户,是在晚高峰进行的体验。
一个最易被用户感知的亮点,同样也是划分今年智驾“领先一代”的功能——车位到车位,实装上车了。
可以看到,用户在接近自家小区地库入口时,AD Max系统直接从城市NOA切换到自主记忆泊车AVP,直接来了一个丝滑的转弯入库,最牛X的地方在于系统已经能够自主过闸机了:
同时意味着在高速路端,AD Max也能自主过收费站。
进入地库后,先是来了一个180度U型转弯掉头,然后直奔车位而去,过程中成功避让了地库内大大小小不规则的承重柱/墙和一位行人:
最后是一连串丝滑的停车入库,本身难度不大,但连接起整个行车、泊车智驾体验,给用户带来的实用性和新引力是巨大的:
在公开路段上,AD Max V13.0也有令人惊喜的进步。
另外一位用户@陈伟有理想上传了AD Max V13.0在一段高速施工+大车博弈路段的表现。
一开始是系统正在完成对一辆低速卡车的超越,“不跟慢车”以及避让大车的通行策略,几乎是所有NOA的共识。但超车还未完成,就遇到了路边施工占道:
AD Max V13.0在贴着桩桶大约3-5mide样子迅速完成了向右变道避让,全程没有任何让人不舒适的紧急刹车,等于同时完成超车+避让。
“端味”更强的一点在于,系统现在会更加灵活贯彻效率优先通行策略。
以前是提前2公里就变道最右侧,即使前面有慢车也会尾随。
但现在系统会尽量多的超过右侧慢车,在车道变成实线之前迅速完成向右并线,用户的这个实测案例是600m的距离:
端到端优势,在城市道路内体现的更极致,比如现在AD Max V13.0已经能够处理不规则的复杂环路——处在几个立交桥下方,还充斥着各种车和车、人和车、两轮车和车的博弈:
从前面各个实测画面中,其实能看出理想AD Max V13.0的另一个重大变化——AI可视化。
首先是右侧现在实时显示10条可能的行驶路线及其概率:
路线一致性越高,说明场景越简单,反之说明场景更加复杂,路线选择的不确定性在上升——直观完整的把端到端思考过程展现在用户面前,增强信任感。
第二个可视化功能是“热力图”注意力系统,告诉你系统现在关注目标的优先级——越“红”的说明系统目前注意力分配越多,让你直观看到智驾系统的“防御性驾驶”策略。
最后是屏幕最右侧的智能驾驶翻译官,由理想自研VLM(视觉语言模型) 实时解说智驾系统的策略以及给出建议。
把复杂高深的智驾技术、智驾系统决策过程这个“大黑盒”打开,用大白话呈现翻译。
有啥用?
大大提升用户对智驾的信任和熟悉程度,好用之外,增加“爱用”的理由。
几乎所有智驾玩家都死磕corner case,认为这是阻碍用户信任智驾的核心。当然没错,不过体现的是纯纯的理工科思维。
怎么在产品体验、用户心理接受度和观感上下功夫,从来没人思考过。
论“懂用户”和产品体验,理想当仁不让。
理想V13 800万clips训练,啥水平
理想最新AD Max V13.0系统,官方的描述中出现了一个新表述:
800万clips训练数据。
啥意思?
所谓clips就是片段,一整条带有时间特征的行车视频数据,一般一个clips持续约30s左右,是从上亿公里的真实数据中精挑细选出来的“五星司机”数据,同时数据标注过程、模型的训练过程已经实现完全的自动化。
与之前自动驾驶“系统学习XX帧数据”的表述完全不同。
背后体现的是整个行业技术范式的深刻变化。
体现在理想AD Max V13.0,就是“一快一慢”两系统。
快的是端到端模型本身,应对实时驾驶任务,也就是可视化屏幕上左侧概率路线和注意力的部分;慢的则是VLM大模型,用来学习常识,应对未知路况,比如潮汐车道等等,对应屏幕右侧的实时解说部分。
端到端负责感知、决策、规划,是AI司机的主体。并且理想端到端不同于华为,采用更直接的One Model结构,不分层:
输入传感器数据,直接输出自车行驶轨迹。
One Model典型玩家是特斯拉,国内的商汤绝影UniAD也选择了这条路线,同样也走到了量产前夜。
至于VLM,本质是一个多模态大模型,作用是智能驾驶“点读机”,哪里不会点哪里,利用大语言模型的认知能力理解场景,输出另外一条行驶轨迹给端到端模型参考修正。
为啥要这么做?理想解释因为端到端模型尽管直接学习人类成熟驾驶经验,但黑盒决策过程不为人知。对于目标的错检漏检,以及幻觉问题难以通过直接调参解决。
所以要加这么一个“点读机”,以及适当的强化学习手段来规范端到端模型的行为。
总结一下理想端到端智驾技术:
最大的不同点是没用国内主流的多段式结构,而是和特斯拉One Model一样一步到位,而且也是国内量产进度最快的。
但理想和特斯拉不同的点又在于,选择用语言模型为基础的多模态模型作为认知能力的补充,和小鹏、蔚来、商汤等等玩家相同。
以及还有一点,端到端模型参数量4-5亿,VLM总参数量22亿,完全能在现有Orin芯片的理想各个MAX车型上实现车端部署。
最后就是迭代速度的“断代式”领先:
四个月内,AD MAX系统已经学习了64000小时左右老司机的驾驶经验。
理想提速反映了什么?
2024年底2025年初,智驾卷出新速度。
比亚迪、小鹏,蔚来,理想…都提速了。
比如小鹏赶在年末最后一天,推送了车位到车位先锋版小范围内测;蔚来李斌明确了今年将主攻高阶智驾的安全体验;大疆和比亚迪,则专注极致性价比方案在10万级车型的普及…极氪甚至在2024年12月31日还来了一波赶KPI式的交卷。
不同玩家选择的技术路线、硬件方案、落地车型价位各有不同,但最后交付到用户,看可以实现的能力就行。而站在2024年12月31日之前,围绕智能驾驶,最先进的一代——领先一代,就是可以实现全量推送的车位到车位体验,结束内测或者小范围公测,可以直接提现技术的成熟度。
其次是能够实现城区NOA的次世代,高速环路NOA的正当代……以及大部分只有L2的“落后一代”。
当然在中国市场,最特殊的自然莫过于特斯拉,其代表领先一代的FSD还没能获准中国上路,但因为马斯克超前的布局和超强的技术坚持,每一辆已经上路的特斯拉,拥有FSD能力大概也就差一次OTA而已。作为端到端范式的最早实践者,也作为车位到车位实现路径的引领者,特斯拉是一个特殊的存在,一个让所有中国智驾玩家枕戈待旦不敢轻视的存在。
不过随着车位到车位的智驾技术推送实现,智驾的起点和终点也就已经卷到头了。
剩下的就是整个过程中的产品体验、用户体验,这也是理想正在快速展现势能和动能转换的关键原因。
实际上,理想造车以来,并不以智驾先声夺人,但站在当前来看,优势正在越来越显而易见。
首先是AI大模型、通用能力作为自动驾驶核心基调,而非简单的驾驶任务。全球范围内,自研基础大模型基座的造车玩家,似乎只有特斯拉和理想。
而明确讲VLM、多模态和智驾模型融合,理想则迈出行业第一步。
第二点,理想“套娃”的造车方式如今来看,绝不仅仅是省成本这个层面的考虑。相同的设计带来相同的传感器布置、带来相同的底层硬件方案。
从AI软件上来看,套娃直接创造了相同模组下的硬件载具,方案统一、接口统一、数据统一,迭代起来也会更加高效,实现规模效应——在scaling law作用下的今天,更显关键。
第三点,理想其实从一开始就暴露过智驾方向上的野心。
从理想ONE开始,理想的智能驾驶功能,不仅标配,而且免费,这就打掉了用户使用的门槛,可以让车主用户成为影子模式迭代下,最直接的参与者。相比无法随车标配、额外付费的业内方式,理想算是以终为始地看清了AI迭代的本质,利在长远。
不少人有过疑问,为什么理想在2024年忽然就实现了智驾能力上大步提升。如果严格审视,答案在理想ONE的时候就已经在谋篇布局了。
只不过不是所有标配免费的智驾方案,都会成为智驾能力飞升的充分必要条件,原因很简单——
你必须卖得足够好,上路得车足够多,有效智驾里程的积累足够巨大。
而理想做到了,先是ONE一代的蓄势,然后是L系列的引爆,销量一飞冲天之后,智能驾驶或者AI需要的数据规模,在理想这里也就变成了资源、势能和潜力要素。
智能驾驶的道路千万条,但第一性原理只有一条:数据。
毕竟AI的第一性原理,就是数据。
马斯克最早洞察了这个原理,所以选择了和谷歌Waymo不一样的自动驾驶实现路径,并且已经展现出了志在必得的潜力,可以更早夺取金杯。
理想似乎也洞察了这个原理,所以在传感器、硬件、软件方案等方面,都早早开启了统一标准化布局,又赶上了端到端范式的变革,完美契合“数据驱动”的核心引擎,让scaling law发挥作用。
所以理想的这个智能驾驶表现和影响,可能才刚刚开始。
其实评价理想的智能驾驶水平,还有另一个更“客观”的维度。
在华为“遥遥领先”的智驾水平、营销声势之下,华为赋能的车型几乎和理想在巷战肉搏竞争,同样是家用SUV、同样有增程路线,但最后理想还能保持月销5W的水平,没被打趴下……
这几乎就是对理想智驾水平最直接的反映了。
One more thing
最后再补充一点有意思的。
特斯拉Autopilot资深工程师Yun-Ta Tsai曾分享称,ChatGPT这样的互联网AI对毫秒级别的延迟不敏感,但自动驾驶、机器人必须在吞吐量和延迟之间寻找平衡。所以有两个级别的系统在发挥作用:
在低级机械控制中,只有几微秒的时间,就像火箭发动机一样,在偏离航线之前几乎没有时间调整推力;另一个高级系统,则必须在做出重大决策之前汇总所有信息。
与理想的快慢系统颇有相似之处,若特斯拉FSD也采用类似的架构(从未公布过),应该不让人感到意外。
- 大疆智驾王炸:32TOPS跑通端到端,纯视觉有路就能开2025-01-07
- 黄仁勋自掏腰包50亿,手把手教AI公司用好GPU2024-12-31
- 理想:自研热管理技术第一梯队,冬季纯电续航提升15%2024-12-18
- 大疆自动驾驶,获中国销量TOP 2车企同时入股2024-12-17