图像编辑与重绘
这类模型要求极高的上下文一致性,通常基于扩散模型微调而来。
PowerPaint (v2)
定位:目前开源界最全能的图像编辑专精模型之一。
能力:支持带有 Prompt 指导的局部重绘、消除物体(Object Removal)、形状引导生成以及图像向外扩展(Outpainting)。
部署:可独立运行 Python 推理脚本,也已有成熟的 ComfyUI 节点。
Flux.1 Fill (dev/schnell)
定位:基于 FLUX 架构最新推出的原生 Inpainting 模型。
能力:继承了 FLUX 变态级的文本遵循和结构准确度,是目前处理高分辨率、复杂逻辑重绘的画质天花板。
部署:通过 diffusers 库或 ComfyUI 调用,极其消耗显存(推荐使用 FP8 量化版本)。
BrushNet
定位:一种即插即用的局部重绘架构。
能力:它不像传统的 Inpainting 模型那样需要重新训练整个底模,而是作为一个外挂分支(类似 ControlNet)附加在任意 SD1.5 或 SDXL 模型上,灵活性极高。