Robotaxi的护城河,正在被L2玩家填平
虽然鲁迅的家后面有两棵树,一棵是枣树,另一棵也是枣树,但是,一直以来,自动驾驶领域却泾渭分明地存在着两个阵营,一边是面向量产车的L2级辅助驾驶,一边是面向无人驾驶出租车的L4级自动驾驶。曾几何时,L2和L4在追求目标、安全要求和技术路径上存在着巨大的断层,它们操着不同的技术语言,遵循着迥异的工程哲学,奔赴着看似永无交集的彼岸。但是,随着数据驱动的端到端神经网络范式的出现,蹉跎十年之久的L2迎来了每年十倍速的进展,L2辅助驾驶开始向着L3有条件自动驾驶叩关,越来越多L2级阵营的头部玩家也纷纷宣布或者实质性地进入了Robotaxi玩家的禁脔。L2与L4之间井水不犯河水的固有格局被打破了,行业内慢慢形成一个清晰的共识:L2和L4之间并不存在不可逾越的鸿沟、无法跨越的天堑。
范式趋于统一
无规矩不成方圆。在技术路线眼花缭乱、宣传口径五花八门的自动驾驶行业里,尽管有部分遥遥领先的玩家认为基于SAE J3016的L1-L5分级标准落后于时代的发展,但它代表着统一的技术语言和标尺,标志着次第分明的秩序,设定着明确的预期,管理着错误认知的风险。

图片来源:华为
L2辅助驾驶系统要求人类司机为最终安全负责,在功能上以驾驶辅助与体验为核心,L4高等级自动驾驶系统本身成为安全责任主体,以在限定区域内实现绝对安全为根本追求。在规则驱动与模块化算法的传统架构下,这种不同导致了截然相反的技术路径。
L4系统为达成极高的安全完备性,不得不在感知、预测、规划、控制等每个模块中堆叠海量规则,使得系统变得极为复杂、笨重且难以泛化。相反,量产L2系统因需兼顾成本、算力与即时可用性,通常采用更轻量、聚焦于特定功能的简化算法。因此,二者在规则的规模与复杂度上存在着本质的差距。

图片来源:英伟达
总之,由于L2追求有限场景下的体验与可控成本,L4追求限定区域内的功能完备与绝对安全,这种目标与实现方式的根本差异,使得它们在规则驱动的分模块技术范式下,形成了清晰的技术断层。
数据驱动的端到端范式的出现,彻底改变了这一局面。端到端旨在用单个庞大的深度神经网络,直接处理摄像头、激光雷达、毫米波雷达、麦克风等传感器输入,输出转向、加减速等车辆控制指令。根据地平线首席科学家苏箐的说法,端到端是自动驾驶领域近十年来的真范式革命,其作用堪比当年让小日子吃蘑菇炒鸡蛋的原子弹。
在端到端的帮助下,L2级玩家在一两年内取得了几十倍的进展。首先,在模仿学习的帮助下,通过观摩人类专家司机的驾驶视频,端到端系统学会了人类驾驶员的预判能力,实现了平滑和高效的驾驶风格,做出的决策更合理,乘坐体验更加舒适和自然。其次,得益于强化学习,端到端展现了强大的泛化能力和攻克长尾场景的巨大潜力,它可以举一反三地理解场景的本质,不再慌慌张张、连滚带爬,而是从从容容、游刃有余地应对从未见过的场景。再加上其改进的主要方式是投喂更多更高质量的数据,系统可以通过数据闭环自动迭代升级,进化的速度和效率远非分模块时代的手工编码可比。

图片来源:小鹏汽车
在一系列优势的驱动下,在特斯拉的引领和带动下,L2玩家和L4玩家纷纷向端到端范式转型。于是,在同一个范式下,在追求同一个智能内核的终极目标下,两个阵营在算法层面实现交汇,顺利会师了。
这里的智能内核既包括空间智能,也包括语言智能。自动驾驶系统理解三维物理世界、预测其它交通参与者的运动轨迹、进行丝滑拟人的规划的能力都来自于空间智能,同时,理解非结构化的模糊人类指令、与其它交通参与者进行意图沟通、处理基于语言的导航命令也离不开语言智能的加持。当这样一个既懂物理规则又懂人类交互的AI大脑被训练出来,它既可以安全谨慎地执行L2辅助驾驶任务,也具备了在ODD内实现L4无人驾驶的潜力。也就是说,在新的端到端范式到来之后,L2和L4的方法论终于统一了,而且,在智能的追求上,L2和L4达成了共识,走上了融合之路。
数据是共同且唯一的燃料
忠诚不绝对,就是绝对不忠诚。或许是因为向端到端转型太难,本土自动驾驶行业分化出了各种各样的端到端方案,但是,遵循端到端的本意,真正的端到端方案只有一种,那就是「真一段式端到端」。真一段式端到端的核心特点是抛弃一切规则,完全数据驱动。当抛弃了人为编写的规则,海量高质量且具备丰富多样性的数据成了推动自动驾驶端到端神经网络能力进步的唯一燃料。

图片来源:长城汽车
从L2到L4,端到端架起了从辅助到无人的桥板,海量的数据铺就了抵达彼岸的渐进之路。当L2和L4技术路线的边界因为端到端范式变得模糊之后,决定模型能力的数据规模、质量、多样性成了L2和L4之间的真正分野。
有一个小故事可以佐证数据的威力。当年,特斯拉在实验端到端范式之时,起初训练了一百万个Clips(视频片段),系统勉强工作(barely works),200万个Clips时,有所改善(a little better),300万个Clips时,系统表现开始让人感到惊喜(feel delightful),到了1000万个Clips时,在马斯克的口中,系统表现达到了令人难以置信的水平(unbelievable)。
有一段曲线也可以证实数据之于自动驾驶能力的作用力。2024年,理想汽车将技术栈切换到端到端范式上,随着训练数据规模的一路攀升,代表其辅助驾驶系统能力的平均接管里程也开始一路攀升。自7月30日MPI为12.21公里的第一版端到端系统起,到了12月16日,理想AD MAX的MPI已经提升到了71.59公里。

图片来源:理想汽车
在端到端范式下,从L2到L4的演进路径是这样的,首先,在面向广大消费者的量产乘用车上低成本地实现L2辅助驾驶系统的量产落地,依靠百万级车队提供无与伦比的数据规模与多样性,然后,在数据闭环和基础设施的加持下,利用大量真实路采数据炼丹,持续优化端到端模型,随着L2级辅助驾驶处理复杂场景的能力的逐步增强,用户得到了更舒适、更可靠的L2++体验,用户基数和行驶里程进一步扩大,产生更多的数据,更多的数据喂养出更智能的大脑,更智能的大脑兑现更出色的体验,更出色的体验吸引越来越多的用户,共同提高、互相促进的数据飞轮就这么形成了。

图片来源:Momenta
从L2到L4,不过是在数据飞轮的驱动下,系统能力持续增强,以至于需要人类接管的频率越来越低,最终在特定场景下实现了无人接管而已。而无人接管,就是L4!
写在最后
自动驾驶算法由规则驱动的分模块方案转向数据驱动的端到端神经网络方案之后,在模仿学习、强化学习的双双推动下,端到端自动驾驶一举突破了人为设定规则的天花板,打破了曾经横亘在L2和L4之间的界限。曾经的L2玩家们依靠前装量产方案,牢牢占据了推动模型能力进步的数据这项关键资产,在“量产方案产生海量数据->海量数据反哺模型进步->体验提升带动智驾普及->更多里程产生更多数据”的飞轮闭环中,智驾系统正在完成从辅助驾驶到自动驾驶的平滑演进。这么说下来,那些Robotaxi赛道的老玩家们,着实有些危险了!












评论