OpenAI深夜放大招！最强视频模型Sora 2来了，还能自动生成声音

10月1日，全球科技与影视圈迎来重磅消息：OpenAI于今日凌晨正式推出其革命性的视频生成模型Sora 2，标志着AI在影像创作领域的又一次飞跃。这款备受期待的升级版模型不仅在视觉真实感上实现了质的提升，更首次引入了同步音频生成功能，让AI生成内容迈向多模态融合的新阶段。

Sora 2并非孤立的技术突破，而是建立在初代模型基础上的全面进化。回顾2024年2月发布的初代版本，尽管已展现出惊人的画面构建能力，但在处理复杂物理运动时仍显生硬，例如篮球弹跳轨迹或人物行走姿态常缺乏自然流畅感。而此次更新后，新模型对现实世界物理规律的理解显著增强，无论是光影折射、流体动态还是人体动作，都呈现出前所未有的真实质感。

更引人注目的是，Sora 2首次具备语音生成能力。尽管OpenAI坦承当前系统尚不完美，输出中仍可能出现语义错乱或发音偏差，但这一功能的实现验证了通过海量视频数据训练，AI正逐步逼近对现实世界的完整模拟。用户现在不仅能“看到”虚拟场景，还能“听到”与之匹配的声音环境，极大拓展了创作边界。

伴随模型发布，OpenAI同步上线了专属移动应用，并已在iOS平台开启邀请制测试。初期仅面向美国和加拿大用户开放，申请者需完成视频与语音双重身份验证，方可获得使用资格。该应用界面设计贴近主流社交平台，内置个性化信息流推荐机制，并新增“可调节排序”选项，允许用户按兴趣偏好自定义内容展示逻辑。

考虑到视频生成对计算资源的巨大消耗，OpenAI明确表示将对免费额度进行限制，以确保服务稳定性。未来可能推出的付费方案，则旨在为专业创作者提供更多生成配额。目前公司尚未公布具体定价策略，但强调商业化的首要目标是平衡用户体验与系统负载。

面对公众对滥用风险的担忧，OpenAI发布了详尽的安全白皮书。所有由Sora生成的内容均嵌入不可见水印及元数据标识，用于追踪来源。系统严格遵循知情同意原则，任何人像的使用必须获得本人授权，并支持随时撤回。针对青少年群体，平台将启用家长监护机制与使用时长管控。

内容审核方面，Sora内置多层防护体系，可在生成环节实时拦截涉及暴力、恐怖主义、自残等违规内容。通过分析连续帧画面与音频信号，系统能有效识别潜在风险。此外，OpenAI计划扩大人工审核团队规模，重点监控可能引发网络霸凌的敏感内容。

在官方看来，Sora 2不仅是工具迭代，更是通向通用世界模拟器的关键一步。“我们正见证视频模型的飞速演进，”OpenAI在声明中表示，“这将推动机器人智能体的发展，并最终重塑人类社会的运作方式。”

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复