Stable Diffusion ControlNet预处理器详细解读

共计 1528 个字符,预计需要花费 4 分钟才能阅读完成。

大家好,我是 Stable Diffusion 中文网的小编,在本文中,我们将详细解读 Stable Diffusion 的不同预处理器,以及它们在图像生成中的应用。这些预处理器是非常强大的工具,可以帮助你调整图像,突出物体的特征,并控制图像内的各种元素。

  1. Canny 边缘检测 Canny 边缘检测是一种通过边缘检测器创建高对比度轮廓的方式,用于检测输入图像中的物体。这个预处理器可以捕捉非常详细的信息,但需要注意,如果图像的背景中有其他物体,它可能会误检测不需要的物体。因此,最佳的模型选择是 control_sd15_canny。在使用时,确保背景中物体较少,效果会更好。
  2. Depth & Depth Leres Depth 预处理器有助于生成图像的深度估计,用于控制图像内物体的空间位置。深色区域表示物体离观察者较远,而浅色区域表示物体离观察者较近。要注意的是,在处理大图像时,可能会丢失一些细节,例如面部表情。通常与 control_sd15_depth 模型一起使用,可以通过 Midas Resolution 函数来控制 detectmap 的大小和细节级别。

Depth Leres 与 Depth 有相似的概念,但包括更广泛的范围。它可以突出更多的细节,但有时可能会捕捉过多的信息,导致生成的图像与原始图像略有不同。建议尝试这两种预处理器,然后选择适合您需求的那一个。

Stable Diffusion ControlNet 预处理器详细解读

  1. HED (Holistically-Nested Edge Detection) HED 预处理器用于创建清晰且精细的边界,输出类似于 Canny 的效果,但减少了噪声并产生更柔和的边缘。它可以捕捉复杂的细节和轮廓,同时保留细节特征,如面部表情、头发和手指。最佳的模型选择是 control_sd15_hed,可以用于修改图像的风格和颜色。
  2. MLSD (Mobile Line Segment Detection) MLSD 预处理器适用于生成具有独特和刚性轮廓的强有力线条,用于检测建筑和其他人造结构。然而,它不适用于处理非刚性或弯曲的物体。MLSD 适合生成室内布局或建筑结构的图像,因为它可以突出直线和边缘。最佳的模型选择是 control_sd15_mlsd。
  3. Normal map 法线图使用不同的颜色通道(红、绿、蓝)来精确描述物体的粗糙度和光滑度,以及物体的定位。它生成物体的基本估计,可以保留相当多的细节,但有时可能会产生意外的效果,因为法线图完全基于图像,而非 3D 建模软件。法线图适合突出复杂的细节和轮廓,尤其在物体的距离和角度方面非常有效。您可以使用 ”Normal Background Threshold” 参数来调整背景成分,以满足您的需求。
  4. OpenPose OpenPose 预处理器生成基本的骨骼火柴人形象,这种技术非常流行,因为多个 OpenPose 骨架可以组合成一个图像,有助于稳定扩散生成多个一致的主题。骨架图包含多个关节点,每个节点代表特定部位。
  5. Scribble 涂鸦预处理器用于从简单的黑白线条画和草图生成图像。用户可以使用 ”Canvas” 选项创建指定大小的空白画布,也可以手动绘制或上传图像。如果您的草图和绘图是由白色背景上的黑线组成,可以勾选 ”Invert Input Color” 选项。最佳的模型选择是 control_sd15_openpose。
  6. Segmentation 分割预处理器用于检测并将上传的图像分割为同一图像内的不同段或区域。在生成一组新图像时,它会应用 detectmap 图像,与所选的稳定扩散模型一起使用。

以上是 Stable Diffusion 的一些常用预处理器,它们可以在图像生成中发挥重要作用。选择合适的预处理器取决于您的具体需求和项目的性质。希望这些信息对您有所帮助,让您更好地理解 Stable Diffusion 的功能和应用。

正文完