Stable Diffusion 文生图 txt2img介绍

共计 812 个字符,预计需要花费 3 分钟才能阅读完成。

Stable Diffusion 中的文生图采样脚本名为 ”txt2img”,它可以根据用户提供的提示词和选项参数生成图像文件。用户可以选择采样器类型、图像尺寸和随机种子等参数。生成的图像带有数位浮水印标签,以标识其是由 Stable Diffusion 生成的。需要注意的是,如果图像被调整大小或旋转,浮水印将失去效果。训练 Stable Diffusion 模型时使用的数据集由 512×512 分辨率的图像组成,因此生成图像的最佳配置也是 512×512 分辨率,偏离这个尺寸会导致生成输出质量下降。Stable Diffusion 2.0 版本后引入了 768×768 分辨率图像的生成能力。Stable Diffusion 文生图 txt2img 介绍

txt2img 的生成过程参数

每次生成图像都涉及一个随机种子,可以选择随机化种子以获得不同的生成结果,或者使用相同的种子以获得与之前生成的图像相同的结果。此外,用户还可以调整采样迭代步数,较高的值需要更长的运行时间,但较小的值可能会导致视觉缺陷。另一个可配置的选项是无分类指导比例值,它允许用户调整提示词的相关性。较低的值适用于实验性或创造性的用例,而较高的值适用于希望获得更具体输出的用例。

反向提示词的作用

Stable Diffusion 的一些用户界面软件(如 StabilityAI 的 ”Dreamstudio” 云端软件)中包含了反向提示词的功能。它允许用户指定在图像生成过程中应避免的提示。这对于由于用户提供的普通提示词或模型最初的训练而导致图像输出中出现不良特征(如畸形手脚)非常有用。与使用强调符不同,使用反向提示词在降低生成不良图像的频率方面具有高度统计显著的效果。强调符是另一种增加提示词部分权重的方法,一些 Stable Diffusion 的开源实现中使用括号来增加或减少强调。

通过 Stable Diffusion 中的文生图生成过程,用户可以根据提示词和选项参数生成各种风格的图像。反向提示词功能使用户能够更好地控制生成图像的质量和特征,提供更好的用户体验。

正文完