在生成式人工智能的热潮逐渐从语言模型向更深层次演进之际,一场围绕“理解世界”而非仅仅“描述世界”的技术竞赛已然拉开帷幕。被誉为“AI教母”的李飞飞,再次以前瞻性布局抢占先机——她于2024年创立的初创公司World Labs,正推进一轮估值高达50亿美元的新融资,目标募资额达5亿美元。
这一数字令人瞠目:短短12个月内,World Labs的估值从10亿美元飙升至5倍之多。资本市场的狂热并非无的放矢,它既是对李飞飞学术权威与产业洞察力的高度认可,更是对“大世界模型”(Large World Model, LWM)这一技术路线投下的重注。在这场AI范式的迁移中,语言不再是终点,而是通往物理世界建模的起点。
World Labs自2024年4月成立之初,便携带着2亿美元的初始估值登场,背后站着a16z、Radical Ventures等重量级风投。随后,英伟达、新加坡主权基金淡马锡,以及Google首席科学家Jeff Dean等AI领域的“顶流”纷纷加入股东行列,迅速将其推入独角兽俱乐部。而真正点燃投资热情的,是其正在构建的核心技术——一种能够模拟、生成并交互于三维物理空间的“大世界模型”。
李飞飞团队推出的首个产品Marble,已能通过一段文字或一张图片,自动生成结构完整、可自由探索的3D环境。更重要的是,该模型输出的不仅是视觉效果,还包括用于物理仿真和机器人训练的关键“碰撞网格”,为具身智能提供了底层支撑。这标志着AI正从“看图说话”迈向“理解空间、预测行为”的新阶段。
在李飞飞的构想中,“世界模型”是实现“空间智能”的基础设施。它不仅要复现现实世界的几何与动力学规则,还需整合视觉、语言、动作等多模态信息,并具备对未来状态的推理能力。这种能力将彻底重塑AIGC生态——无论是人工智能领域的虚拟制片、游戏开发中的动态场景生成,还是未来家庭服务机器人的环境适应,都将因世界模型而获得质的飞跃。
有趣的是,这场关于“如何建模世界”的技术路线之争,已形成双雄对峙格局。图灵奖得主Yann LeCun所创立的AMI Labs同样备受瞩目,目前以35亿美元估值寻求新一轮融资。但LeCun坚持采用基于JEPA(联合嵌入预测架构)的抽象表征路径,强调对世界状态的隐式建模,而非直接生成显式的3D场景。两种哲学,两种未来。
当顶级科学家与千亿资本在“空间智能”的十字路口交汇,AI的下一个十年轮廓已然清晰:语言只是序章,世界才是舞台。一个能理解重力、遮挡、因果与交互的智能体,正在从实验室走向现实——而我们,正站在新纪元的门槛上。
