微软搞出AI配音新花样：能生成90秒多人对话，声音跟真人一样

8月30日，据科技资讯平台Windows Latest于昨日披露，微软在其Copilot Labs创新实验区悄然上线了一款名为Copilot Audio Expressions的全新AI语音生成工具，旨在为用户提供更具情感张力与叙事魅力的英文语音内容。这款工具一经推出，便以其拟人化的表达方式和灵活的创作模式引发业界关注。

据悉，Copilot Audio Expressions的核心亮点在于其能够突破传统AI语音机械朗读的局限，通过智能算法对文本进行润色与情绪注入，使输出的音频更贴近真人发声的自然质感。目前，该工具对公众开放免费体验，无需注册账号即可直接使用，生成的音频支持MP3格式下载，便于在各类终端设备上播放与分享，极大提升了使用的便捷性。

该工具现阶段主推两大创作模式：Emotive（情感表达）与Story（故事创作），满足不同场景下的语音生成需求。

在Emotive模式下，用户可自主选择音色与叙述风格。媒体实测中，选取了“Oak”这一沉稳音色搭配“narration”叙述方式，并输入一段模拟火车站场景的脚本。结果令人惊喜：AI不仅准确朗读了原文，更在语调起伏、措辞衔接与氛围营造上进行了智能优化，使整体表达更具画面感与感染力。单次生成音频最长可达59秒，且提供十余种音色与风格的自由组合，赋予用户高度的创作自由。

而Story模式则展现出更强的叙事智能。用户只需输入简单的主题提示，例如“讲一个猫在暗处潜行觅食的故事”，系统便会自动匹配合适的音色与节奏。测试中，AI生成了一段近90秒的多角色音频，旁白采用自然流畅的美式口音，而猫咪的独白则巧妙切换为英式腔调，两者交替出现，辅以细腻的语气变化与情境互动，营造出宛如专业配音团队协作完成的沉浸式听觉体验。

评测指出，Story模式在情节推进、角色声音区分及整体节奏把控上表现卓越，成品远非单调的文本转语音，而是具备戏剧张力的音频作品，适用于播客、有声故事乃至创意短剧的制作。

不过，目前该工具仅支持英文内容生成，中文及其他语言用户尚无法体验母语级别的语音合成效果。微软方面暂未明确透露未来是否会拓展多语言支持，这也成为众多非英语用户关注的焦点。

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复