强化学习上车了，智能驾驶直接对标FSD

“合资品牌搞不了智能驾驶”？这个曾经被广泛讨论的质疑，在9月15日的别克至境L7发布会上，被彻底推翻。上汽通用副总经理薛海涛在现场掷地有声地回应：“谁说合资品牌做不好智驾？”更令人瞩目的是，发布会现场直接搭建了一个包含7个车位的泊车测试区，实车演示至境L7的智能泊车辅助功能——这在中国汽车发布会历史上，堪称破天荒的首次。

测试项目极具挑战性：极窄垂直泊入、断头路垂直泊入、断头路逆向限位器水平泊入……这些日常用车中的“老大难”场景，至境L7均一气呵成，精准入位。薛海涛在演示后自信宣告：“从今天起，‘合资无智驾’的说法，可以彻底终结了。我们的表现不仅在合资阵营中遥遥领先，即便面对行业顶尖玩家，也毫不逊色。”

这份底气，源自至境L7首发搭载的Momenta R6强化学习飞轮大模型——国内首个基于端到端架构、真正实现量产落地的强化学习大模型。它的上车，标志着中国智能驾驶正式迈入强化学习时代。

那么，强化学习究竟有何魔力？与当前主流的“端到端+模仿学习”相比，它又带来了哪些本质突破？

简单来说，模仿学习是“照着人做”，而强化学习是“自己试错成长”。就像学骑自行车，摔倒、调整、再尝试，最终掌握平衡——这正是强化学习的核心逻辑。在自动驾驶领域，仅靠模仿人类驾驶，天花板明显。小马智行创始人楼天城曾指出，模仿学习无法闭环，车辆缺失人类驾驶员依赖的诸多隐性信息，越模仿反而可能偏离越远。

行业早已意识到这一点。Waymo在技术论文中明确表示“模仿远远不够”，其通过结合强化学习，仅用10万英里数据训练，就使最难场景的失败率下降超38%。特斯拉FSD的惊人适应力，也被普遍认为离不开强化学习的加持。尽管马斯克不再公开技术细节，但其招聘启事中赫然写着“需掌握强化学习技术”，其人形机器人Optimus的舞蹈能力，更是完全通过强化学习在模拟环境中训练而成。

然而，强化学习长期受限于安全、数据、算力等现实瓶颈。真实道路无法允许AI“试错”，高质量长尾数据难以获取，复杂模型训练耗时巨大。Momenta的破局之道，正是其“一个飞轮两条腿”战略：通过L2级智能驾驶量产，快速积累海量真实路况数据；同时推进Robotaxi研发，形成技术反哺。目前，Momenta已拥有超30亿公里实战数据，为其R6大模型提供了坚实基础。

搭载R6大模型的至境L7，实现了“无断点”城市NOA，并首发“多步变一步、不停车一键泊入”等全场景辅助功能。在发布会前的极限测试中，车辆成功应对“高速消失前车”和“盲区左转车”等高危场景，主动制动避险。Momenta CEO曹旭东解释，强化学习模型不仅学习“好数据”，更能从“坏数据”中提炼更优策略，从而在极端情况下做出比人类更安全、更流畅的决策。

更深远的意义在于，Momenta正与享道出行、Uber合作，打造基于前装量产车的Robotaxi车队，复用量产硬件，无需后装改造——这与特斯拉的路径高度相似。数据飞轮一旦高速运转，智能驾驶的迭代将呈指数级加速。正如曹旭东所言，他们不仅要追赶智驾的“摩尔定律”，更要超越它。一个由AI自我进化驱动的、真正超越人类驾驶安全水平的未来，正加速驶来。

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复