AI绘图|Stable diffusion模型如何区分？通俗易懂，入门必看！-风棱跨境网

在使用Stable diffusion进行AI绘图时，经常遇到大模型、VAE、LORA，看到这些概念，头就有点懵懵的，不知道怎样进行选择，下面我给大家简单讲下：

1、简单说说模型后缀

.ckpt 的全称是 checkpoint，中文翻译就是检查点，这是 TensorFlow中用于保存模型参数的格式，通常与 .meta 文件一起使用，以便恢复训练过程。

简单理解的话，.ckpt模型就好比我们打游戏时，每通过一关时对这一关的一个“存档”，因为你在训练模型时也是如此，没办法保证能一次就训练成功，中途是有可能因为各种因素失败的，所以可能在训练到20%时就存一次档，训练到40%时又存一次档，这也是为什么它叫 checkpoint 的一个原因。

讲完了 .ckpt 模型，那么就该说说 .safetensors 模型了。

之所以有 .safetensors 模型，是因为 .ckpt 为了让我们能够从之前训练的状态恢复训练，好比从50%这个点位重新开始训练，从而保存了比较多的训练信息，比如模型的权重、优化器的状态还有一些Python代码。

这种做法有两个问题，一是可能包含恶意代码，因此不建议从未知或不信任的来源下载并加载.ckpt 模型文件；二是模型的体积较大，一般真人版的单个模型的大小在7GB左右，动漫版的在2-5GB之间。

而 .safetensors 模型则是 huggingface 推出的新的模型存储格式，专门为Stable Diffusion模型设计。这种格式的文件只保存模型的权重，而不包含优化器状态或其他信息，这也就意味着它通常用于模型的最终版本，当我们只关心模型的性能，而不需要了解训练过程中的详细信息时，这种格式便是一个很好的选择。

由于 .safetensors 只保存模型的权重，没有代码，所以会更安全；另外由于保存的信息更少，所以它的体积也比 .ckpt 小，加载也更快，所以目前是比较推荐使用 .safetensors 的模型文件。

2、再说说模型的分类

在Stable diffusion中，模型主要分为五大类，分别是Stable diffusion模型、VAE模型、Lora模型。

2.1 Stable diffusion大模型

这类模型俗称“底模”，对应下面这个位置。

这类模型代表了Stable diffusion的一个知识库，比如说我们训练大模型用的全是二次元的图片，那么它最终生成的图片效果也会趋于二次元；而如果训练的时候用的是真人图片，则最终出图效果则趋于真人。

由于这类模型包含的素材非常多，训练的时间也非常长，所以体积也比较大，一般在2GB以上，后缀的话就是上面提到的 .ckpt 和 .safetensors

2.2 VAE模型

VAE全称Variational autoenconder，中文叫变分自编码器，这种模型可以简单理解为起到一个滤镜的效果。在生成图片的过程中，主要影响的是图片的颜色效果。

一般来讲，在生成图片时，如果没有外挂VAE模型，生成的图片整体颜色会比较暗淡；而外挂了VAE模型的图片整体颜色会比较明亮。

注：左边是没有使用VAE生成的图片，右边是使用VAE生成的图片

不过需要注意的是，有一些大模型在训练的时候就已经嵌入了VAE的效果，所以即使没有使用VAE效果，出图的效果也不会那么暗淡。

另外，有时候使用VAE反倒会出现一个不好的效果，比如在最后一刻变成一张蓝色废图，这时候就需要把外挂VAE改成自动（Automatic）即可

注：像这种即为蓝色废图

2.3 Lora模型

Lora模型想必大家都经常看到了，LoRA的英文全称为Low-Rank Adaptation of Large Language Models，直译为“大语言模型的低阶适应”。这是一项由微软研究人员提出的大语言模型微调技术，简单来说，它的作用是让这些庞大的模型变得更加灵活和高效，能够在特定任务上进行优化（比如对样式进行一些修改），而不需要从头开始训练整个模型。

比如像下面这个Lora模型，就是在大模型的基础上增加一些森林水母发光的效果（就是我们不必为了增加这个效果，重新训练我们的大模型，因为训练大模型花费时间很长，通过Lora就可以提高效率）