8月30日,据科技资讯平台Windows Latest于昨日披露,微软在其Copilot Labs创新实验区悄然上线了一款名为Copilot Audio Expressions的全新AI语音生成工具,旨在为用户提供更具情感张力与叙事魅力的英文语音内容。这款工具一经推出,便以其拟人化的表达方式和灵活的创作模式引发业界关注。

据悉,Copilot Audio Expressions的核心亮点在于其能够突破传统AI语音机械朗读的局限,通过智能算法对文本进行润色与情绪注入,使输出的音频更贴近真人发声的自然质感。目前,该工具对公众开放免费体验,无需注册账号即可直接使用,生成的音频支持MP3格式下载,便于在各类终端设备上播放与分享,极大提升了使用的便捷性。
该工具现阶段主推两大创作模式:Emotive(情感表达)与Story(故事创作),满足不同场景下的语音生成需求。
在Emotive模式下,用户可自主选择音色与叙述风格。媒体实测中,选取了“Oak”这一沉稳音色搭配“narration”叙述方式,并输入一段模拟火车站场景的脚本。结果令人惊喜:AI不仅准确朗读了原文,更在语调起伏、措辞衔接与氛围营造上进行了智能优化,使整体表达更具画面感与感染力。单次生成音频最长可达59秒,且提供十余种音色与风格的自由组合,赋予用户高度的创作自由。

而Story模式则展现出更强的叙事智能。用户只需输入简单的主题提示,例如“讲一个猫在暗处潜行觅食的故事”,系统便会自动匹配合适的音色与节奏。测试中,AI生成了一段近90秒的多角色音频,旁白采用自然流畅的美式口音,而猫咪的独白则巧妙切换为英式腔调,两者交替出现,辅以细腻的语气变化与情境互动,营造出宛如专业配音团队协作完成的沉浸式听觉体验。
评测指出,Story模式在情节推进、角色声音区分及整体节奏把控上表现卓越,成品远非单调的文本转语音,而是具备戏剧张力的音频作品,适用于播客、有声故事乃至创意短剧的制作。

不过,目前该工具仅支持英文内容生成,中文及其他语言用户尚无法体验母语级别的语音合成效果。微软方面暂未明确透露未来是否会拓展多语言支持,这也成为众多非英语用户关注的焦点。
