12月2日,千问App迎来重磅升级,正式推出两款业界领先的视觉生成模型——通义万相Wan2.5与Qwen-Image的“满血特供版”。这两款模型目前已在最新版千问App中开放免费体验,用户无需额外操作,即可直接使用这些前沿AI能力。

据官方介绍,通义万相Wan2.5堪称当前国内最强的视频生成模型之一。其最大亮点在于具备罕见的音画同步能力,不仅能根据输入内容自动生成匹配画面的人声、环境音效和背景音乐(BGM),还能确保声音节奏与人物动作高度协调。该模型采用原生多模态架构,仅需上传一张静态图片并配以简短文字描述,系统便能自动生成一段最高1080P分辨率、时长可达10秒的高清唱跳视频。尤为引人注目的是,生成视频中的人物肢体动作流畅自然,口型精准贴合语音内容。无论是真实人物照片、宠物形象、二次元角色,还是历史文物或卡通IP,通义万相Wan2.5均能高质量处理,展现出极强的泛化能力与场景适应性。
与此同时,千问App此次还独家上线了全球最强开源图像模型Qwen-Image的增强版本。新版本在图像一致性保持方面表现卓越,尤其在多视角转换、跨图融合及多模态逻辑推理等关键维度上实现技术突破。用户现可通过该模型对图片中的文字进行高精度编辑与修改,例如替换广告牌上的标语、调整海报文案等,操作直观且效果逼真。此外,Qwen-Image支持双图“拼贴”与“深度融合”功能,允许用户基于一张参考图对另一张图像进行风格迁移或细节重构。值得一提的是,该模型在生成亚洲人像时显著提升了真实感与细节还原度,中文文本渲染稳定性也大幅优化,整体输出质量已达到可直接用于商业宣传的海报设计水准。
此次千问App的更新不仅标志着阿里在AIGC(人工智能生成内容)领域的持续领跑,也为普通用户提供了触手可及的创意工具。随着音视频与图像生成技术门槛的不断降低,AI正从专业工作室走向大众日常创作场景,开启全民智能创作的新阶段。
