12月25日消息,阿里通义Qwen团队在本月23日发布了全新的图像编辑模型Qwen-Image-Edit-2511。这一更新是在先前的Qwen-Image-Edit-2509版本基础上进行了多项优化,包括减轻图像漂移现象、提高人物一致性的表现、集成LoRA能力以及增强工业设计生成能力,并且提升了几何推理的能力。

作为通义家族视觉生成领域中的最新成员,Qwen-Image-Edit-2511特别针对“图像编辑”场景进行了专门的优化。与传统的文生图(Text-to-Image)模型不同,Qwen-Image-Edit-2511专注于解决一个特定的问题:如何在保持原图主体结构不变的前提下,对选定区域进行精准修改。这为设计师和开发者提供了一个更加高效的人工智能辅助工具。
其中,Qwen-Image-Edit-2511最引人注目的特性是其卓越的指令遵循能力。用户不再需要深入了解Photoshop等专业软件的复杂操作,也不必手动创建选区。只需要简单输入类似“将图片中的猫替换为狗”或者“从背景中移除路人”的自然语言指令,该模型就能自动识别用户的意图并执行相应的操作。
通过深度融合视觉编码器和语言模型,Qwen-Image-Edit-2511能够精确地辨识图像中的语义对象,在对目标物体进行编辑的同时,尽可能保留原始图像的光影效果、纹理细节及背景的一致性。

此外,Qwen-Image-Edit-2511还改进了对于人物一致性处理的能力,即使在进行富有创意的编辑时,也能确保主体的身份特征和视觉风格得到保留。例如,它可以在多人合影的情况下实现高保真的融合,创造出一张和谐统一的群像照片:
新模型进一步集成了精选的热门LoRA功能,无需额外的微调即可直接使用。比如,在光照增强方面,用户可以直接利用这些内置的功能来获得逼真的照明效果:
不仅如此,Qwen-Image-Edit-2511还在几何推理方面有了显著的进步,可以为设计或标注用途自动生成辅助构造线,使得设计工作流程更为流畅。

Qwen-Image-Edit-2511不仅仅是一个简单的升级版,而是代表了在图像编辑技术上的一个重要进步。它让非专业人士也能够轻松完成以往需要高度专业技能才能达成的任务,极大地降低了图像编辑的技术门槛,同时也为专业人士提供了更多创造的可能性。无论是个人爱好者还是专业设计师,都能从中受益,享受更加便捷高效的图像编辑体验。
