678CHAT AI资讯 Meta搞了个新模型CWM,写代码、看代码都更轻松了

Meta搞了个新模型CWM,写代码、看代码都更轻松了

在影视科技前沿传来新动态,OpenAI近日宣布其研发团队成功推出了一款名为“场景理解模型”(Scene Understanding Model,简称 SUM)的先进人工智能系统,该系统专为影视剧本的视觉化生成与虚拟场景构建而设计。

Meta搞了个新模型CWM,写代码、看代码都更轻松了插图

这一技术突破标志着AI在影视内容创作领域的深度介入,SUM不再局限于对剧本文字的表面解析,而是致力于理解情节发展背后的视觉逻辑与空间关系。通过分析海量影视作品中镜头语言、角色动线与场景调度的关联数据,SUM构建了一个动态的“场景认知框架”,使其能够预测并生成符合叙事逻辑的三维虚拟环境。

传统的AI剧本可视化工具多依赖关键词匹配与静态图像拼接,难以应对复杂剧情中的时空连贯性需求。OpenAI研究人员认为,真正的影视化理解需要模型具备“导演思维”,即在生成画面时,不仅要识别“谁在做什么”,还要理解“为何如此呈现”以及“接下来可能发生什么”。这种能力对于现代影视工业化流程尤为重要,尤其是在预演(pre-visualization)和虚拟制片环节。

SUM的训练机制采用了分阶段认知强化策略,尤其在中期训练中便引入了动态场景演化数据,而非仅在后期进行画面优化。其核心训练数据包含两大部分:一是从经典电影中提取的镜头序列与叙事节奏标注,二是基于虚拟引擎中AI角色与环境互动的行为日志。这些数据使SUM能够学习到镜头切换、光影变化与情绪推进之间的深层关联。

在实际测试中,SUM展现了卓越的生成能力。在多个影视创意评估基准中,其生成场景的叙事连贯性与艺术表现力均超越现有模型。例如,在“剧本到分镜”转换测试中,SUM的导演意图还原度达到78.3%,在复杂群戏调度与情感氛围营造方面也获得专业评审的高度评价。尽管成果显著,OpenAI仍强调SUM目前仅限研究用途,尚未开放公众访问,也不具备直接生成商业成片的能力。

研究团队展望未来,认为将“世界模型”理念融入影视AI,有望推动内容创作从自动化迈向智能化。这一进展预示着,未来的AI不仅能辅助创作,更能成为理解人类叙事逻辑的“数字创意伙伴”。

入口:https://openai.com/research/sum-a-new-ai-model-for-film-scene-understanding

划重点:

🎬 SUM模型深入理解剧本的视觉叙事逻辑,而不仅是文字转图像。

🎥 通过电影镜头序列与虚拟环境互动数据训练,强化AI的“导演思维”。

🏆 在分镜生成与场景调度测试中表现突出,展现AI影视创作的巨大潜力。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/20965.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部