stablediffusion图生图怎么用(参数详解)

共计 991 个字符,预计需要花费 3 分钟才能阅读完成。

stablediffusion 图生图怎么用(参数详解)

Stable Diffusion 中文网介绍了一项令人惊叹的功能,即图生图(img2img),它利用 InstructPix2Pix 技术让 AI 参照现有的图片进行绘图。

无论是将真人照片绘制成动漫人物,还是给线稿上色,甚至是修复黑白照片为彩色相片,图生图都能轻松实现。

参数解说

部分参数与文生图的参数重叠,这里不再赘述。

裁切模式

裁切模式决定对上传的图片进行何种操作,建议上传的图片与生图设置一致。

  • Just resize:调整图片为生图设置的宽高。如果上传的图片宽高与生成设置不一致,则图片会被压扁。
  • Crop and resize:裁切图片以符合生图的宽高。
  • Resize and fill:裁切并调整图片宽高,如果上传的图片宽高与生成设置不一致,则多出来的区域会自动填满。
  • Just resize (latent upscale):调整图片大小为生图设置的宽高,并使用潜在空间放大。

Resize to

根据填入的宽高进行绘图。

Resize by

根据填入的缩放系数进行绘图,并缩放图片。

Denoising strength

降噪强度的数值越小,生成的图与原图越相似,可用来微调图片。

Interrogate Deepbooru

上传图片后,利用 Danbooru 图库的数据判断图片并自动填入提示词。需要注意的是,Deepbooru 训练的图像数量有限,它只能用来识别图片的场景和人物标签,并不能准确标出最新的动漫角色。

初次使用时,Stable Diffusion WebUI 会自动下载模型。

Interrogate CLIP

与 Deepbooru 类似,但更适用于判断真人照片的内容。

实际操作

点击框框上传图片。图片的比例需要与生成设置的宽高一致,例如,如果设置生成的宽高为 512×512,则需要上传宽高为 1:1 比例的图片。

在左上角的字段中填入正负向的提示词,即告诉 AI 希望将图片绘制成什么样子。如果需要恢复面部特征,勾选 ”Restore faces”,然后点击右上角的 ”Generate” 按钮进行绘图。

图生图界面的左下方有 CFG Scale 和 Denoising strength 两个数值,它们决定生成图像与原图的相似程度。如下图所示,降低 Denoising strength 的数值可以微调原图。

通过图生图功能,AI 绘图的神奇之处得以展现,让我们能够轻松实现各种想象力的创作。无论是艺术家还是普通用户,都可以通过这个功能创造出独一无二的作品。快来尝试一下吧!

正文完