随着DALL-E-2和Midjourney的发布,您可能听说过最近 AI 生成艺术的繁荣。这些人工智能模型如何在几秒钟内创造性地生成逼真的图像,这绝对是令人兴奋的。您可以在这里查看其中的一些:DALL-E-2 gallery和Midjourney gallery
但是这些模型是封闭源代码并且在付费墙后面(非常有限的免费使用),我实际上不得不等待 1 个月才能访问 DALL-E-2,限制为每月大约 15 次免费使用提示。
Stability刚刚为公众发布了 DALL-E-2 和 Midjourney 背后技术的开源替代版本,称为Stable Diffusion。演示和源代码以拥抱的方式发布。
最好的部分是它可以在具有高于平均水平的 Nvidia GPU(VRAM 低于 8GB)容量的本地机器上运行,也可以在 M1 和 M2 Macbooks 上运行!
这很有趣,因为稳定扩散似乎比其他 AI 模型更强大和动态。它甚至可以在两个不同的文本提示之间进行插值和做梦。可爱的开源社区的所有力量使这成为可能♥
⚠️本博客将介绍在 Windows 10 机器上进行稳定扩散的步骤
先决条件(适用于 Windows 10)
硬件要求
- 可用磁盘空间 - 至少 10GB
- RAM - 16GB 用于更快的安装(也应该在 8GB 机器上工作)
- 具有 CUDA 内核的 Nvidia GPU - 至少 6GB
我正在使用我的游戏 PC,它有 16GB 的 RAM 和 Nvidia RTX 2070 Super 和 8GB VRAM
软件要求
- 下载并安装Git,这应该很简单
- 下载并安装anaconda dist
-
conda --version
安装后,确保您已安装 git bash 并通过在命令行中运行来检查 conda 安装。- 如果未找到 conda,则
PATH
按照本教程在您的环境中添加 conda 变量
- 如果未找到 conda,则
- 下载模型检查点文件(⚠ 大约 4GB,您需要创建一个帐户)
- 从这里下载并解压稳定的扩散模型加载器和梦想脚本
配置conda
- 打开 git bash
- 您需要通过运行设置 conda shell
conda init bash
- 重新打开 git bash
加载辅助模型和包以实现稳定的扩散梦想
- 打开 git bash
- 通过在命令行中运行创建 conda env
```
conda env create -f environment.yaml
```
-
激活 conda 环境
conda activate ldm
-
此时,你的 git bash 应该是这样的(注意前面的 ldm)
(ldm) user@user-name MINGW64 ~/stable-diffusion-main
-
此过程应安装所有必需的软件包,这可能需要一段时间
-
加载模型,这可能还需要一段时间,如果你没有在 SSD 上运行它,那么去喝杯咖啡☕ 并等待
success
消息。python scripts/preload_models.py
加载检查点文件
- 如果您在尝试运行梦想脚本时遇到以下错误,这是必要的先决条件...
super(_open_file, self).__init__(open(name, mode))
FileNotFoundError: [Errno 2] No such file or directory: 'models/ldm/stable-diffusion-v1/model.ckpt'
- 将 4GB 检查点文件重命名为
model.ckpt
- 将该文件复制到稳定扩散克隆回购中
stable-diffusion-main\models\ldm\stable-diffusion-v1\model.ckpt
升空🚀
-
你现在应该准备好运行梦想脚本了✨
python scripts/dream.py
-
这应该会给你一个 repl,你可以用它给出任何提示,它会生成一个图像!
-
在 RTX 2070 Super 中为我生成单个图像最多需要 15 秒,它可能因 GPU 和图像大小而异。
- 运行脚本后监控你的 GPU,脚本应该已经使用了你 GPU 近 95% 的 VRAM 🥵🥵
如果您不是 CLI 的忠实拥护者,您可以使用 Web GUI,并通过运行来启动梦想服务器
python3 scripts/dream.py --web
导航到http://localhost:9090/并输入任何内容!你的创造力就是你的极限。要获得一些灵感,您可以访问lexica.art以获得一些即时的想法。
🍎 对于 M1 和 M2 用户,步骤应该是相同的,但有一些修改,你可以按照这里或这里的演练
如果你设法让它工作,请在下面用你的提示评论🌻
网友评论