Skip to content

更简更全的顶级图像编辑模型 Qwen-Image-Edit-2511-AIO

功能介绍

顶级图像编辑模型 Qwen-Image-Edit-2511 中我们介绍了官方的 qwen-image-edit-2511 bf16 模型的 13 种使用姿势。官方的工作流相对复杂(13个在用节点),且比较正经,显存占用相对较大,bf16 模型用到了 42G 显存(独显+共享显存)。

本节介绍一个 qwen-image-edit-2511 的 AIO(all-in-one) 模型 Qwen-Image-Edit-Rapid-AIO,该模型具有以下特点:

  1. 工作流简单:将 diffusion 模型 / vae 模型 / clip 模型 / 加速模型融合成了一个模型,极大的简化了工作流的搭建;
  2. 支持文生图:不传递图片即可,实测效果低于 z-image,估计也低于昨天发布的 qwen-image-2512
  3. 性能较高:社区大佬测试下来该模型的性能要高于官方模型的 fp8 版本;另外,该模型融合了 qwen-image-edit-2511qwen-image-edit-2509 的优点,在部分场景还要优于 qwen-image-edit-2511 bf16 模型(见下面的“效果展示”部分)
  4. 支持范围较广:同时支持正经和不正经能力
  5. 更省显存:rtx4090 显卡测试下,用到 22G 显存

效果展示

图像编辑

prompt: 将整张图片转换为高度写实的真人摄影风格,将人物面部特征精确重塑为亚洲人面孔,皮肤皙白

img.png

prompt: 将女孩的衣服换成纯白色,上衣胸部写着“qwen不错”,文字需要与衣服贴合

img.png

在该示例中,Qwen-Image-Edit-Rapid-AIO 模型要优于 qwen-image-edit-2511 bf16 模型的表现,文字与衣服的贴合度更好,后者的表现见 顶级图像编辑模型 Qwen-Image-Edit-2511

文生图

prompt: “赛博朋克风格”,地府背景,诡异。神明世界里狂风呼啸,空间扭曲变形,巨大的、面目模糊的唐三藏身影自发光(法天象地的气势,神圣庄严的法相),双手合十,望向渺小的众多百鬼,散发着丝丝杀意,风卷着残叶,仿佛要将面前的一切都摧毁。昏暗,梦幻,史诗,压迫感,雾霾,低饱和度,低亮度,巨人,巨物恐惧,(俯视超广角),压迫感的构图,电影级构图,视觉冲击,8K画质,超清,极致细节,极致刻画,清晰的线条,高对比,大师级别的作品。尖锐特写,无限细节,极繁主义。

img.png

文生图效果个人感觉差于 z-image,相同的提示词生成的图片见 最真实的文生图模型 z-image 集成 lora 工作流

模型下载

插件安装(可选)

使用插件管理器安装 Comfyui-QwenEditUtils 插件,安装完成之后,重启 ComfyUI

img_1.png

目前该融合模型偶现偏移问题,如果发现在生图时出现图像偏移问题,可以借助该插件进行处理。

搭建工作流

图像编辑

官方节点版: img_2.png

QwenEditUtils 插件版:

img.png

说明:AIO 模型官方推荐的采样器和调度器组合(euler_ancestral / beta)

文生图

img_3.png

说明:将图像编辑工作流中的图像输入断掉,就是文生图工作流,看上去效果比 z-image 差很多,前者 AI 感太强,后者更加真实。

总结

关于 qwen-image-edit-2509 / qwen-image-edit-2511 / Qwen-Image-Edit-Rapid-AIO 的使用场景:

  1. qwen-image-edit-2509 不再使用,直接删除;
  2. qwen-image-edit-2511:bf16 版,绝大多数情况下使用该模型;
  3. Qwen-Image-Edit-Rapid-AIO:显存不足;文字生成(假如 qwen-image-edit-2511 无法胜任);不正经场景

文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!