对话周光:L4不存在了,L2、L3然后L5
端到端重写自动驾驶秩序?
李根 发自 副驾寺
智能车参考 | 公众号 AI4Auto
“跟L4的朋友们还有联系吗?”
元戎启行CEO周光,没有正面回答。
三年前在深圳福田,周光带队打造的元戎启行Robotaxi测试车,带我穿过了闹市晚高峰,后来还一路送我到深圳机场,全程自动驾驶,即便是在深圳会展中心商厦的临时停车车流里,元戎Robotaxi也见缝插针穿了出去——没有宕机,没有远程协助,没有接管。
作为元戎启行CEO,周光三年前谈论的所有话题都自带语境限定:L4级自动驾驶。元戎启行的对外介绍,也是一家L4级自动驾驶公司。
在自动驾驶行业术语中,L4是一个分水岭,区别于L3,L4彻底摆脱了人类驾驶员依赖;而区别于L5,L4还只能在限定场景和范围里使用,即所谓的ODD(Operational design domain)区域,L5才能真正实现完全无人驾驶。
但三年后的2024年,周光以背叛者、布道者形象在更正、在反复强调:
L4是伪概念,或者说L4不存在了。
因为端到端的全新AI范式,正在重塑所有产业,包括交通场景下的自动驾驶。
端到端、无图、AI 2.0
周光强调的端到端,更具体指代的是正在汹涌的AI算法范式。
简单粗暴理解,就是以前自动驾驶可能会按照不同功能划分为感知模块、控制模块、定位模块、规划决策模块……但从2023年CVPR最佳论文直接颁向端到端前后,新范式涌出的新高度。
端到端范式下,整个自动驾驶系统只有一个模块,或者说只有一个神经网络——你也可以理解为AI大脑,感知数据信号输出,最后决策数据信号输出,宛如人类开车驾驶。
在自动驾驶领域,周光现在是端到端的布道者、绝对信徒。
他说之前自动驾驶的模块和堆栈,开发时涉及模块之间的参数传递,人为定义接口,必然会过滤到一些信息,最后导致处理的场景有限。
同时因为每个模块之间“不可求导”,导致各个模块只能达到模块上的局部最优,而无法实现整体的全局最优。
更直白来说,一旦在自动驾驶场景中,依然依赖于人为规则的算法,机器就永远会遇到长尾场景,无法消除。自动驾驶车辆,很难有“人味”,即像人类一样随机应变地处理场景挑战。
周光拿来举例的场景体验是变道——四车道变道,人类的驾驶基本是一条线拉到底完成变道,但规则算法驱动下的机器,只会像鲤鱼一样,一条道一条道变道。
这种产品体验上的不同,背后技术上的高下也非常明显。
周光解释,端到端的优势就在于,当你做一些决策需要高级别的时候可能非常完美,像传统的自动驾驶可能只需要看1、2秒就行了,你的决策可能就基于这1、2秒,稍微长点就会决策不准。但是端到端,可以做到10秒钟左右精准的判断,10秒跟1、2秒差很多。
这种技术上展现的高下之别,让他惊喜、兴奋,周光认为:自动驾驶甚至整个机器人行业的AI 1.0时代结束了。
1.0时代是什么时代?
靠人编程写规则,教神经网络学会开车,然后不断定义和处理Coner Case的时代,即便追求的完全无人的自动驾驶,也需要在一定阶段里有ODD、限定条件和区域的时代,即L4的时代。
AI2.0又是什么时代?
整个AI司机的大脑就是一个神经网络大模型,不分模块,不分堆栈,它接收感知信号,然后输出决策信号。
更众所周知的实践是特斯拉FSD的V12版本,马斯克下令剔除了几乎所有人类规则代码,99%以上决策都交给了神经网络,最后整个FSD反而有了质变提升,并且被马斯克视为升维Robotaxi的关键里程碑。
周光跟马斯克有着一样的看法。
但据说周光对外分享这个认知比马斯克更早,在2023年3月份的时候,周光和某大佬会面谈到了这个,后来5月份该大佬在硅谷和马斯克见面,马斯克谈到正在往端到端路线推进——这也让该大佬意识到元戎启行的年轻CEO有点东西。
周光对这个很激动也很感慨,他的说法是如果你连续选对了技术判断,多少意味着点什么……这个连续,连的是端到端之前,周光和元戎启行团队提倡的前融合,以及无图。
无图就是不靠高精度地图。在华为开始在无图智驾、城区NOA的“遥遥领先”攻势开始前,高精度地图被视为自动驾驶的标配,作为一种“冗余”,高精度地图让智驾在高速、快速路上进展很快,但一度也因为高精地图,大大制约了智驾落地量产的速度,特别是进城的速度。高精度地图也是L4落地中的必备要素。
周光透露,元戎今年去做量产、去做资质审核的时候,直接拿的就是导航地图,有导航地图的地方就能智驾,但发现其他玩家并非如此,比如在一些十字路口,会有高精度地图辅助打补丁。
所以元戎启行CEO强调自己的方案是“真无图”,这是技术先进性的体现,因为只有端到端才能真无图,没有无图就没有端到端,也只有端到端和真无图了才能更快实现全域覆盖落地,全国都能开。
实际上,元戎启行和华为一度传出过绯闻,而且周光谈论的方案,跟华为智驾最新发布的也大同小异。
但被追问与华为之间的真实情况时,周光选择了不回答。
江湖上的一种说法是,华为的“遥遥领先”背后实际就是元戎启行的供应;另一种说法则是元戎只是和华为有过智驾层面的接触和交流。
但不论哪一种说法,现如今展现的事实很明确:
第一,华为和元戎启行都选择了无图、端到端的智驾推进路线。
第二,华为智驾方案,现在公开的说法很明确:完全自研。
所以元戎启行的量产方案,又上车了哪里?
周光再次表示出于“客户第一”,无法奉告。
但在采访现场,他似乎在等一个随时可能前来展台的客户,他多次交代同事:门开着,不要关,X总来了我需要马上出去。
而X总正是某巨头车厂的总裁。
智驾也分高阶和低阶
我问周光,他是不是太过在意手段上的分辨——如果自动驾驶的终点都一致,最后就是要实现AI司机对各种路况和场景的接管,有图无图、端到端与否、算不算AI2.0……是不是都不本质?
周光不认同,他认为认知上、理念上的洞藏很重要,决定了过程,也会决定结果。
他反复说的一句话是:编程不等于AI了,靠rule base实现不了通用……只有端到端才能实现通用自动驾驶,或者说现实世界驾驶场景里的通用人工智能。
所以周光的观点是,端到端、AI2.0带来的影响的直接影响是什么?是L4这个AI1.0时代被划分出来的概念和阶段,被证伪了。
端到端会打破限定区域和条件,L4就不再有意义,不存在了。
这个观点,周光更早一些的时候公开表达过,引发轩然大波,其后在一家知名L4独角兽公司的交流现场,这个观点也被作为问题抛了出来。
那家L4独角兽CEO的回答,大意是L4很难,做不出来的玩家,自然认为L4是伪概念。
而周光则不打算回应这种回应了,他举起双手像投降又像鼓掌,“我无话可说,我祝福,别人愿意在他坚持的道路上想跑多远就跑多远,跑越远越好。”
他现在的认知很明确,量产自动驾驶(L2+L3),然后就是完全无人驾驶(L5)。
因为无图会加速智能驾驶普及,周光特别强调的是二线、三线城市的普及和落地,这才是真正考验技术实力的地方。
然后普及带来的数据雪球,会在端到端的网络和迭代中,实现质变,或者说涌现。
周光类比的是iPhone,他认为端到端意味着AI2.0的开始,意味着iPhone被发明出来了,然后数据雪球会加速实现质变性的那一代iPhone,大势所趋。
周光还强调,端到端带来的影响,不止是自动驾驶层面,在智能驾驶赛道,也会迎来新的格局重塑。
当前在智能驾驶领域,梯队格局是按照技术轴和量产轴来实现的,能实现城区NOA被认为技术上第一梯队,智能驾驶方案量产进展,被视为数据上的核心变量,技术和数据综合起来构成了整体竞争力。
周光认同技术和数据两大维度,但他的观点是,城区NOA的落地、体验,会成为最关键变量。
不能实现城区NOA的,包括高速NOA,都只能称之为“低阶智驾”。低阶智驾可以靠高精度地图、靠rule base……但高阶智驾不行,只能端到端。
而元戎启行,现在是高阶智驾赛道里的玩家——至少拿到了入场券。
在周光的看来,高阶智驾的竞速才刚刚开始,如果让他列供应商名单,包括元戎在内,他认为国内只有三家。
事实上,端到端对元戎启行的影响才是根本性的。
元戎启行创办的5年,或者更早的那段时间里,公司的愿景说的还是L4、自动驾驶。
但最近,周光带队做了调整:“打造物理世界的通用人工智能”。
相比自动驾驶,这是一个更宏大的目标,包含自动驾驶,也包含了机器人,或者更时髦的具身智能。
不过周光也强调,汽车是实现这种愿景——物理世界通用人工智能——唯一途径,因为端到端系统需要海量数据,现如今除了汽车,没有其他的机器人形态可以提供和实现。
所以在被问到“跟L4的朋友们还有联系吗”时,元戎启行CEO给出了这样的回答:
“我现在跟AGI的人交流比较多,我喜欢跟厉害的人交流。”
- 长安发布飞行汽车、人形机器人计划,数智技术引领车市新风向2024-11-15
- 红旗不藏了:纯视觉端到端智驾,固态电池也安排了2024-11-14
- 上海曝光重庆车企上市时间表:300亿估值,三大资源派生态化反2024-11-08
- All in端到端后元戎获7亿融资,被曝长城独投!用L2+直达Robotaxi2024-11-05