由知名科技媒体人李岩领衔的智能应用观察实验室“深探局”近日发布了一项引人瞩目的AI影视创意能力测评项目——“剧本角力场”(Script Arena),旨在评估当前主流大语言模型在影视内容创作领域的叙事构建、角色塑造与市场适配潜力。该项目首次将大模型生成的短剧剧本投入真实观众测试环境,通过专业评审打分与虚拟市场反馈双维度进行综合评估,所有模型均基于相同的题材设定和人物框架进行创作,确保测试条件高度统一。

本次测评共邀请六款在多模态与文本生成领域表现突出的大模型参与,包括GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1以及阿里云研发的Qwen3Max。每部AI生成的15分钟都市情感短剧均被制作成概念预告片,并在独立搭建的线上平台向超过5000名目标观众投放,收集完播率、情感共鸣评分及商业价值预估等关键数据。结果显示,DeepSeek V3.1与Grok-4展现出卓越的叙事张力与情感细腻度,其作品在观众留存率与品牌植入接受度上遥遥领先,综合评分并列榜首;而Gemini2.5Pro生成的剧本则因情节逻辑断裂、人物动机模糊,遭遇市场冷遇,最终在商业转化潜力评估中垫底,成为本次测试的最大意外。
“深探局”负责人表示,“剧本角力场”的核心目标并非简单排名,而是探索AI在创意工业化链条中的真实边界——从灵感孵化到受众反馈闭环,检验不同模型架构在理解人类情感、捕捉社会情绪与构建戏剧冲突方面的深层能力。此次实验标志着大模型的应用正从基础的内容辅助写作,加速迈向高阶的原创内容生产与市场化验证阶段。随着AI深度介入影视创作前端,未来的内容产业或将迎来由算法驱动的“智能编剧”时代,而如何平衡机器效率与人文温度,将成为行业必须面对的新命题。
