Stable Diffusion 使用指南教程

共计 1358 个字符,预计需要花费 4 分钟才能阅读完成。

调参基础

  • 常用参数介绍
    • **Prompt(提示词):** 对你想要生成的东西进行文字描述。
    • **Negative prompt(反向提示词):** 用文字描述你不希望在图像中出现的东西。
    • Stable Diffusion 使用指南教程
    • **Sampling Steps(采样步数):** 扩散模型的工作方式是从随机高斯噪声向符合提示的图像迈出小步。这样的步骤应该有多少个。更多的步骤意味着从噪声到图像的更小、更精确的步骤。增加这一点直接增加了生成图像所需的时间。回报递减,取决于采样器。
    • **Sampling method(采样器):** 使用哪种采样器。Euler a(ancestral 的简称)以较少的步数产生很大的多样性,但很难做小的调整。随着步数的增加,非 ancestral 采样器都会产生基本相同的图像,如果你不确定的话,可以使用 LMS。
    • **Batch count/n_iter:** 每次生成图像的组数。一次运行生成图像的数量为 Batch count * Batch size。
    • **Batch size:** 同时生成多少个图像。增加这个值可以提高性能,但你也需要更多的 VRAM。图像总数是这个值乘以批次数。除 4090 等高级显卡以外通常保持为 1。
    • **CFG Scale(无分类指导规模):** 图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提示(根据模型),但它也在一定程度上降低了图像质量。可以用更多的采样步骤来抵消。
    • **Width:** 图像的宽度,像素。要增加这个值,你需要更多的显存。大尺度的图像一致性会随着分辨率的提高而变差(模型是在 512×512 的基础上训练的)。非常小的值(例如 256 像素)也会降低图像质量。这个值必须是 8 的倍数。
    • **Height:** 图像高度。
    • **Seed:** 随机数的起点。保持这个值不变,可以多次生成相同(或几乎相同,如果启用了 xformers)的图像。没有什么种子天生就比其他的好,但如果你只是稍微改变你的输入参数,以前产生好结果的种子很可能仍然会产生好结果。
  • 迭代采样步数(Sampling steps)
    • 更多的迭代步数可能会有更好的生成效果,更多细节和锐化,但是会导致生成时间变长。而在实际应用中,30 步和 50 步之间的差异几乎无法区分。
    • 太多的迭代步数也可能适得其反,几乎不会有提高。
    • 进行图生图的时候,正常情况下更弱的降噪强度需要更少的迭代步数 (这是工作原理决定的)。你可以在设置里更改设置,让程序确切执行滑块指定的迭代步数。
  • 采样器(Samplers)
    • 目前好用的有 Euler,Euler a(更细腻),和 DDIM。
    • 推荐 Euler a 和 DDIM,新手推荐使用 Euler a
    • Euler a 富有创造力,不同步数可以生产出不同的图片。调太高步数 (>30) 效果不会更好。
    • DDIM 收敛快,但效率相对较低,因为需要很多 step 才能获得好的结果,适合在重绘时候使用
    • LMS 和 PLMS 是 Euler 的衍生,它们使用一种相关但稍有不同的方法(平均过去的几个步骤以提高准确性)。大概 30 step 可以得到稳定结果
    • PLMS 是一种有效的 LMS(经典方法),可以更好地处理神经网络结构中的奇异性
    • DPM2 是一种神奇的方法,它旨在改进 DDIM,减少步骤以获得良好的结果。它需要每一步运行两次去噪,它的速度大约是 DDIM 的两倍。但是如果你在进行调试提示词的实验,这个采样器效果不怎么样
    • Euler 是最简单的,
正文完