678CHAT AI资讯 强化学习上车了,智能驾驶直接对标FSD

强化学习上车了,智能驾驶直接对标FSD

“合资品牌搞不了智能驾驶”?这个曾经被广泛讨论的质疑,在9月15日的别克至境L7发布会上,被彻底推翻。上汽通用副总经理薛海涛在现场掷地有声地回应:“谁说合资品牌做不好智驾?”更令人瞩目的是,发布会现场直接搭建了一个包含7个车位的泊车测试区,实车演示至境L7的智能泊车辅助功能——这在中国汽车发布会历史上,堪称破天荒的首次。

强化学习上车了,智能驾驶直接对标FSD插图

测试项目极具挑战性:极窄垂直泊入、断头路垂直泊入、断头路逆向限位器水平泊入……这些日常用车中的“老大难”场景,至境L7均一气呵成,精准入位。薛海涛在演示后自信宣告:“从今天起,‘合资无智驾’的说法,可以彻底终结了。我们的表现不仅在合资阵营中遥遥领先,即便面对行业顶尖玩家,也毫不逊色。”

这份底气,源自至境L7首发搭载的Momenta R6强化学习飞轮大模型——国内首个基于端到端架构、真正实现量产落地的强化学习大模型。它的上车,标志着中国智能驾驶正式迈入强化学习时代。

那么,强化学习究竟有何魔力?与当前主流的“端到端+模仿学习”相比,它又带来了哪些本质突破?

强化学习上车了,智能驾驶直接对标FSD插图1

简单来说,模仿学习是“照着人做”,而强化学习是“自己试错成长”。就像学骑自行车,摔倒、调整、再尝试,最终掌握平衡——这正是强化学习的核心逻辑。在自动驾驶领域,仅靠模仿人类驾驶,天花板明显。小马智行创始人楼天城曾指出,模仿学习无法闭环,车辆缺失人类驾驶员依赖的诸多隐性信息,越模仿反而可能偏离越远。

行业早已意识到这一点。Waymo在技术论文中明确表示“模仿远远不够”,其通过结合强化学习,仅用10万英里数据训练,就使最难场景的失败率下降超38%。特斯拉FSD的惊人适应力,也被普遍认为离不开强化学习的加持。尽管马斯克不再公开技术细节,但其招聘启事中赫然写着“需掌握强化学习技术”,其人形机器人Optimus的舞蹈能力,更是完全通过强化学习在模拟环境中训练而成。

然而,强化学习长期受限于安全、数据、算力等现实瓶颈。真实道路无法允许AI“试错”,高质量长尾数据难以获取,复杂模型训练耗时巨大。Momenta的破局之道,正是其“一个飞轮两条腿”战略:通过L2级智能驾驶量产,快速积累海量真实路况数据;同时推进Robotaxi研发,形成技术反哺。目前,Momenta已拥有超30亿公里实战数据,为其R6大模型提供了坚实基础。

搭载R6大模型的至境L7,实现了“无断点”城市NOA,并首发“多步变一步、不停车一键泊入”等全场景辅助功能。在发布会前的极限测试中,车辆成功应对“高速消失前车”和“盲区左转车”等高危场景,主动制动避险。Momenta CEO曹旭东解释,强化学习模型不仅学习“好数据”,更能从“坏数据”中提炼更优策略,从而在极端情况下做出比人类更安全、更流畅的决策。

强化学习上车了,智能驾驶直接对标FSD插图2

更深远的意义在于,Momenta正与享道出行、Uber合作,打造基于前装量产车的Robotaxi车队,复用量产硬件,无需后装改造——这与特斯拉的路径高度相似。数据飞轮一旦高速运转,智能驾驶的迭代将呈指数级加速。正如曹旭东所言,他们不仅要追赶智驾的“摩尔定律”,更要超越它。一个由AI自我进化驱动的、真正超越人类驾驶安全水平的未来,正加速驶来。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/20133.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部