Stable Diffusion 操作界面及基础参数介绍

共计 2092 个字符,预计需要花费 6 分钟才能阅读完成。

了解界面

Stable Diffusion 中文网是一个强大的图像生成工具,可以根据用户提供的文本提示生成惊艳的图像。在使用之前,我们需要了解一些基本的使用方法和界面功能。Stable Diffusion 操作界面及基础参数介绍

使用方法简介

目前,SD 并没有一个通用的使用规范,因为每个人的需求和电脑配置都不尽相同。SD 支持各种 AI 模型、插件和参数的组合,所以在使用过程中需要仔细阅读插件开发者的说明文档,并参考一些分享网站上的使用心得,比如 https://civitai.com/。在 civitai 上,你可以搜索到一些你感兴趣的图例,并根据原作者的提示词、参数和模型进行修改,这样可以更直观地学习使用 SD。

文生图

文生图是根据文本提示生成图像的功能。你可以根据提示词来生成你想要的图像。

图生图

图生图是根据提供的图像和文本提示生成图像的功能。你可以提供一个图像作为范本,然后根据文本提示生成相应的图像。

更多

更多功能包括优化图像的清晰度和扩展图像的内容。

图片信息

图片信息功能可以显示图像的基本信息,包括提示词和模型信息。除非信息被隐藏,你可以在这里查看图像的详细信息。

模型合并

模型合并功能可以将已有的模型按照不同的比例进行合并,生成新的模型。

训练

训练功能可以根据提供的图片训练具有某种图像风格的模型。

描述语和提示词

在使用 SD 时,描述语和提示词非常重要。描述语分为正向描述和负向描述,也被称为标签或提示词。

正向描述词是用来描述你想要生成的图像的特点,描述越精准和细致,AI 的自由发挥空间就越大。

负向描述词是用来排除你不想要的图像特点的,你可以使用负向描述词来告诉 SD 生成图像时避免的内容。

常用的正向描述词包括:masterpiece(杰作)、best quality(最佳质量)、画质词(比如清晰、扩展)、画面描述等。

常用的负向描述词包括:nsfw(不安全内容)、lowres(低分辨率)、bad anatomy(错误的解剖学)、bad hands(不好的手势)、text(文字)、error(错误)、missing fingers(缺少手指)、extra digit(多出的手指)、fewer digits(缺少手指)、cropped(裁剪)、worst quality(最差质量)、low quality(低质量)、normal quality(普通质量)、jpeg artifacts(JPEG 压缩痕迹)、signature(签名)、watermark(水印)、username(用户名)、blurry(模糊)等。

界面功能

在 SD 界面中,有一些常用的功能按钮,它们分别是:

  1. 复原上次生成图片的提示词(自动记录)
  2. 清空当前所有提示词
  3. 打开模型选择界面
  4. 应用选择的风格模板到当前的提示词
  5. 存档当前的正反向提示词

采样方法

在使用 SD 时,有一些采样方法可以帮助你获得你想要的结果。

  1. 建议使用脚本跑网格图来测试不同的参数和提示词,然后选择你喜欢的结果。
  2. 如果你不想进行对比试验,可以使用一些预设的模型,比如 DPM++ 2M 或 DPM++ 2M Karras(适用于二次元图像)或 UniPC。如果你想要一些惊喜和变化,可以尝试使用 Euler a、DPM++ SDE、DPM++ SDE Karras(适用于写实图像)或 DPM2 a Karras(注意调整 eta 值)。
  3. eta 和 sigma 是与多样性相关的参数,它们的多样性来源于步数的变化。如果你想要更大的多样性,应该关注 seed 的变化。eta 和 sigma 参数应该在选择图片框架后进行微调。

采样步数

稳定扩散通过从充满噪音的画布开始创建图像,并逐渐去噪以达到最终输出。采样步数参数控制这些去噪步骤的数量。一般来说,步数越多,生成的图像质量越好。我们建议使用默认值 25 个步骤。以下是一般指南,用于确定在不同情况下使用哪个步骤编号:

  • 如果你正在测试新的提示,并希望快速得到结果来调整你的输入,请使用 10-15 个步骤。
  • 当你找到你喜欢的提示时,请将步骤增加到 25。
  • 如果生成的图像是有毛皮的动物或有纹理的主题,并且缺少一些细节,你可以尝试将步数增加到 40。

其他参数

在使用 SD 时,还有一些其他参数需要注意:

  • 面部修复:修复人物面部的功能,但是非写实风格的人物可能会导致面部崩坏。
  • 平铺:生成一张可以平铺的图像。
  • 高分辨率重绘:使用两个步骤的过程进行生成,首先在较小的分辨率上创建图像,然后在不改变构图的情况下改进细节。在选择该选项时,会有一系列新的参数需要设置,比如放大算法、放大倍数和重绘幅度。
  • 长宽尺寸(分辨率):图像的长宽尺寸并非越大越好,最佳范围应在 512 至 768 像素之间。根据不同的主题对象选择适当的尺寸,必须是 8 的倍数。
  • 生成批次和每批数量:生成批次是每次生成图像的组数,每批数量是同时生成的图像数量。增加每批数量可以提高性能,但也需要更多的显存。
  • 提示词相关性 CFG:CFG 是用来调整生成结果与提示词匹配度的参数。较高的数值将提高匹配度,但可能会降低创造力。一般推荐使用默认值 7。
  • 随机种子(Seed):生成每张图片时的随机种子,用来确定扩散的初始状态。如果不了解这个参数,可以使用随机的种子。

希望以上介绍能帮助你更好地了解 Stable Diffusion 中文网的界面和功能。祝你使用愉快!

正文完