AI炒股大比拼！DeepSeek赚了14%+，Gemini2.5Pro却亏惨了四成

由知名科技媒体人李岩领衔的智能应用观察实验室“深探局”近日发布了一项引人瞩目的AI影视创意能力测评项目——“剧本角力场”（Script Arena），旨在评估当前主流大语言模型在影视内容创作领域的叙事构建、角色塑造与市场适配潜力。该项目首次将大模型生成的短剧剧本投入真实观众测试环境，通过专业评审打分与虚拟市场反馈双维度进行综合评估，所有模型均基于相同的题材设定和人物框架进行创作，确保测试条件高度统一。

本次测评共邀请六款在多模态与文本生成领域表现突出的大模型参与，包括GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1以及阿里云研发的Qwen3Max。每部AI生成的15分钟都市情感短剧均被制作成概念预告片，并在独立搭建的线上平台向超过5000名目标观众投放，收集完播率、情感共鸣评分及商业价值预估等关键数据。结果显示，DeepSeek V3.1与Grok-4展现出卓越的叙事张力与情感细腻度，其作品在观众留存率与品牌植入接受度上遥遥领先，综合评分并列榜首；而Gemini2.5Pro生成的剧本则因情节逻辑断裂、人物动机模糊，遭遇市场冷遇，最终在商业转化潜力评估中垫底，成为本次测试的最大意外。

“深探局”负责人表示，“剧本角力场”的核心目标并非简单排名，而是探索AI在创意工业化链条中的真实边界——从灵感孵化到受众反馈闭环，检验不同模型架构在理解人类情感、捕捉社会情绪与构建戏剧冲突方面的深层能力。此次实验标志着大模型的应用正从基础的内容辅助写作，加速迈向高阶的原创内容生产与市场化验证阶段。随着AI深度介入影视创作前端，未来的内容产业或将迎来由算法驱动的“智能编剧”时代，而如何平衡机器效率与人文温度，将成为行业必须面对的新命题。

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复