安装 trainer
安装之前先修改 windows 脚本执行策略。使用管理员身份打开 WindowsPowerShell。
PS D:\project\stable-diffusion-trainer> Get-ExecutionPolicy
Restricted //会导致无法启动 activate
PS D:\project\stable-diffusion-trainer> Set-ExecutionPolicy RemoteSigned
安装 https://github.com/bmaltais/kohya_ss
安装基础环境
- 安装 Python 3.10
- 安装 Git
- 安装 Visual Studio 2015, 2017, 2019, and 2022 redistributable,下载后双击一路到底,重启电脑
安装 kohya_ss
git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
setup.bat // 这里会安装所需要的其他软件
安装过程中,会让用户填写加速器的配置项。第一个选择 “The machine”,其他选择“NO”。
在 "C:\Users\86150.cache\huggingface\accelerate\default_config.yaml" 下会形成配置文件。
安装 CUDNN 8.6(可选)
对于 NVIDIA 30X0/40X0 系显卡,安装该组件可显著提升训练效率,缩短训练时长。首先下载 CUDNN 8.6,之后解压,将解压后的 cudnn_windows 文件夹移动到 kohya_ss 目录下,之后执行命令:
.\venv\Scripts\activate // 激活 python 容器环境
python .\tools\cudann_1.8_install.py
启动 trainer
首先执行更新操作,防止后续缺包。在 kohya_ss 包下执行
.\upgrade.bat
双击 kohya_ss/gui.bat 或者
gui.bat --listen 127.0.0.1 --server_port 7860 --inbrowser --share
看到如下内容,表示启动成功。
Validating that requirements are satisfied.
All requirements satisfied.
Load CSS...
Running on local URL: http://127.0.0.1:7860
浏览器进行访问 http://127.0.0.1:7860
![](https://img.haomeiwen.com/i5842684/c28a0046dc97aa46.png)
开始训练
预处理-图片裁剪
将图片(50-70张)上传到 https://www.birme.net/ 进行裁剪,裁剪为 512*512,之后下载为 zip 文件。解压到文件夹:
D:\project\stable-diffusion-trainer\trainer-images\liyitong\image\100_myliyitong中
注意:文件名 100_myliyitong,格式“训练步数_触发语”。
预处理-生产图片描述
![](https://img.haomeiwen.com/i5842684/f36de626137dc030.png)
点击后,查看服务台的日志输出,无报错,且显示 captioning done 的时候表示成功。之后在文件夹下可以看到每一个图片的描述语文件(图生文),之后检查每一个描述语的正确性,进行人工修正。
![](https://img.haomeiwen.com/i5842684/29997010da890b9e.png)
开始训练模型
设置训练的基底模型
![](https://img.haomeiwen.com/i5842684/87513a37aa71e3d9.png)
v2 和 v_parameterization 什么时候需要勾选,可以通过选择 Model Quick Pick 下的选项,查看选中情况,当选中自定义模型时,需要查看其对应的 sd 模型,再进行这两个参数的选择。基底模型可从这里查看。
![](https://img.haomeiwen.com/i5842684/75780cd4fbc85f8c.png)
设置文件夹
![](https://img.haomeiwen.com/i5842684/79ab525da4ed3c8c.png)
设置训练参数
![](https://img.haomeiwen.com/i5842684/903109e5e74579cb.png)
![](https://img.haomeiwen.com/i5842684/7a1d99dde6577d84.png)
设置完成后,点击“train model”,开始训练,当看到如下日志,表示训练成功!
running training / 学習開始
num train images * repeats / 学習画像の数×繰り返し回数: 5000
num reg images / 正則化画像の数: 0
num batches per epoch / 1epochのバッチ数: 5000
num epochs / epoch数: 1
batch size per device / バッチサイズ: 1
gradient accumulation steps / 勾配を合計するステップ数 = 1
total optimization steps / 学習ステップ数: 5000
steps: 0%| | 0/5000 [00:00<?, ?it/s]epoch 1/1
steps: 100%|███████████████████████████████████████████████████████████████| 5000/5000 [23:51<00:00, 3.49it/s, loss=0.125]save trained model to D:\project\stable-diffusion-trainer\trainer-images\liyitong\model\myliyitong.safetensors
model saved.
steps: 100%|███████████████████████████████████████████████████████████████| 5000/5000 [23:51<00:00, 3.49it/s, loss=0.125]
训练成功之后,将生成的 lora 文件导入 stable-diffusion/models/Lora 下,开始使用!最后来看看结果。
![](https://img.haomeiwen.com/i5842684/76e31a57f7af26ab.png)
网友评论