跳到主要内容

图像编辑与重绘

这类模型要求极高的上下文一致性,通常基于扩散模型微调而来。

PowerPaint (v2)

定位:目前开源界最全能的图像编辑专精模型之一。

能力:支持带有 Prompt 指导的局部重绘、消除物体(Object Removal)、形状引导生成以及图像向外扩展(Outpainting)。

部署:可独立运行 Python 推理脚本,也已有成熟的 ComfyUI 节点。

Flux.1 Fill (dev/schnell)

定位:基于 FLUX 架构最新推出的原生 Inpainting 模型。

能力:继承了 FLUX 变态级的文本遵循和结构准确度,是目前处理高分辨率、复杂逻辑重绘的画质天花板。

部署:通过 diffusers 库或 ComfyUI 调用,极其消耗显存(推荐使用 FP8 量化版本)。

BrushNet

定位:一种即插即用的局部重绘架构。

能力:它不像传统的 Inpainting 模型那样需要重新训练整个底模,而是作为一个外挂分支(类似 ControlNet)附加在任意 SD1.5 或 SDXL 模型上,灵活性极高。