安装 trainer

安装之前先修改 windows 脚本执行策略。使用管理员身份打开 WindowsPowerShell。

PS D:\project\stable-diffusion-trainer> Get-ExecutionPolicy
Restricted //会导致无法启动 activate
PS D:\project\stable-diffusion-trainer> Set-ExecutionPolicy RemoteSigned

安装 https://github.com/bmaltais/kohya_ss

安装基础环境

安装 Python 3.10
安装 Git
安装 Visual Studio 2015, 2017, 2019, and 2022 redistributable，下载后双击一路到底，重启电脑

安装 kohya_ss

git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
setup.bat // 这里会安装所需要的其他软件

安装过程中，会让用户填写加速器的配置项。第一个选择 “The machine”，其他选择“NO”。
在 "C:\Users\86150.cache\huggingface\accelerate\default_config.yaml" 下会形成配置文件。

安装 CUDNN 8.6（可选）

对于 NVIDIA 30X0/40X0 系显卡，安装该组件可显著提升训练效率，缩短训练时长。首先下载 CUDNN 8.6，之后解压，将解压后的 cudnn_windows 文件夹移动到 kohya_ss 目录下，之后执行命令：

.\venv\Scripts\activate // 激活 python 容器环境
python .\tools\cudann_1.8_install.py

启动 trainer

首先执行更新操作，防止后续缺包。在 kohya_ss 包下执行

.\upgrade.bat

双击 kohya_ss/gui.bat 或者

gui.bat --listen 127.0.0.1 --server_port 7860 --inbrowser --share

看到如下内容，表示启动成功。

Validating that requirements are satisfied.
All requirements satisfied.
Load CSS...
Running on local URL:  http://127.0.0.1:7860

浏览器进行访问 http://127.0.0.1:7860

image.png

开始训练

预处理-图片裁剪

将图片（50-70张）上传到 https://www.birme.net/ 进行裁剪，裁剪为 512*512，之后下载为 zip 文件。解压到文件夹：
D:\project\stable-diffusion-trainer\trainer-images\liyitong\image\100_myliyitong中
注意：文件名 100_myliyitong，格式“训练步数_触发语”。

预处理-生产图片描述

image.png

点击后，查看服务台的日志输出，无报错，且显示 captioning done 的时候表示成功。之后在文件夹下可以看到每一个图片的描述语文件（图生文），之后检查每一个描述语的正确性，进行人工修正。

image.png

开始训练模型

设置训练的基底模型

image.png

v2 和 v_parameterization 什么时候需要勾选，可以通过选择 Model Quick Pick 下的选项，查看选中情况，当选中自定义模型时，需要查看其对应的 sd 模型，再进行这两个参数的选择。基底模型可从这里查看。

image.png

设置文件夹

image.png

设置训练参数

image.png

设置完成后，点击“train model”，开始训练，当看到如下日志，表示训练成功！

running training / 学習開始
  num train images * repeats / 学習画像の数×繰り返し回数: 5000
  num reg images / 正則化画像の数: 0
  num batches per epoch / 1epochのバッチ数: 5000
  num epochs / epoch数: 1
  batch size per device / バッチサイズ: 1
  gradient accumulation steps / 勾配を合計するステップ数 = 1
  total optimization steps / 学習ステップ数: 5000
steps:   0%|                                                                                      | 0/5000 [00:00<?, ?it/s]epoch 1/1
steps: 100%|███████████████████████████████████████████████████████████████| 5000/5000 [23:51<00:00,  3.49it/s, loss=0.125]save trained model to D:\project\stable-diffusion-trainer\trainer-images\liyitong\model\myliyitong.safetensors
model saved.
steps: 100%|███████████████████████████████████████████████████████████████| 5000/5000 [23:51<00:00,  3.49it/s, loss=0.125]

训练成功之后，将生成的 lora 文件导入 stable-diffusion/models/Lora 下，开始使用！最后来看看结果。

image.png