ai绘画怎么训练自己的模型?用Stable Diffusion训练出自己专属的人像模型

共计 1600 个字符,预计需要花费 4 分钟才能阅读完成。

在数字艺术领域,AI 绘画技术已经成为了一项引人注目的技术,让我们可以训练出独特的人像生成模型。稳定扩散(Stable Diffusion)是一个出色的工具,提供了多种模型训练方式,其中之一是 Textual Inversion(Embedding),我们将在本文中介绍如何使用这种方法来创建专属的人像模型。

ai 绘画怎么训练自己的模型?用 Stable Diffusion 训练出自己专属的人像模型

Textual Inversion(Embedding):小巧而强大

相较于其他模型训练方式,如“dream booth”,Textual Inversion(Embedding)的体积要小得多。在“dream booth”中,通常需要庞大的计算资源,而 Textual Inversion 则可以在 Stable Diffusion 内置的 Web 界面中轻松操作。

首先,您需要准备几十张照片,并将它们调整为 512×512 的尺寸,您可以使用 birme 网站来完成这个步骤。

接下来,打开 Stable Diffusion 界面,点击“训练”然后选择“建立嵌入”。在这一步,您需要填写模型的名称、初始化文字(这是在调用模型时使用的词语),以及每个标记的向量数(通常在 6 到 10 之间选择)。

点击“建立嵌入”按钮,系统将为您创建一个.pt 格式的文件,用于存储模型的嵌入信息。

图像预处理和标签

接下来,您需要进行图像预处理和标签的添加。在这一步,您需要填写以下信息:

  • 来源目录:这是您之前处理好的图片所在的目录,通常存储在 Google Drive 中。如果您的文件夹名为“xixiprincess_training”,则来源目录应填写为“/content/drive/MyDrive/xixiprincess_training”。
  • 目标目录:这是保存打上标签的图片的文件夹,您可以在 Google Drive 中新建一个文件夹,例如“xixiprincess_training_input”。

此外,您还可以勾选底部的选项,包括“建立镜像副本”和“使用 deepbooru 生成说明文字”。然后点击“预处理”按钮,系统将为每张图片添加相应的标签,这些标签是对图片的文字描述,将用于训练模型。

模型训练

完成标签的添加后,您可以进行模型的训练。选择之前创建的“xixiprincess_training”文件,如果找不到该文件,可以点击右侧的蓝色按钮刷新一下页面。

在模型训练的设置中,指定资料集目录为刚才创建的“xixiprincess_training_input”,提示模板选择“style_filewords.txt”,其他设置保持默认。然后点击“训练嵌入”按钮。

系统会在每 500 步时展示训练模型的效果预览图。如果您对效果感到满意,可以点击“中止”来结束训练,否则可以继续让训练过程继续进行。一般来说,需要大约 1 万步左右才会出现较好的效果,而有些情况可能需要进行更多的训练,长达 3 万步。通常情况下,1 万步的训练需要大约 1 个半小时。

使用训练好的模型

一旦训练完成,您可以在 Stable Diffusion 的 Web 界面中使用您的新模型。点击右上角的“产生”按钮下面的“Show Extra Networks”按钮,然后选择“textual inversion”。

在提示词输入框中,输入您想要生成的图片的描述,比如:“a girl reading a book in a library”。然后点击您刚刚训练的模型,系统会自动添加相应的提示词,然后点击“生成图片”按钮,即可看到生成的效果。

需要注意的是,Textual Inversion(Embedding)模型相对于其他方式,模型文件非常小,操作也相对简单,但效果可能不如“dream booth”明显,而且训练时间较长。综合来看,选择合适的模型训练方式取决于您的需求和时间投入。

在 Stable Diffusion 中,您可以探索多种方式来培养出独一无二的数字艺术作品,无论您是初学者还是经验丰富的艺术家,都能找到适合自己的方式来创造美妙的艺术作品。

正文完