稳定扩散 - 模型版本

自发布以来，稳定扩散模型经历了重大改进，每个版本都积累了之前版本的经验教训。本章比较了稳定扩散各个版本的功能。

稳定扩散 1.x

第一代稳定扩散模型，称为 1.x 系列，包括 1.1、1.2、1.3、1.4 和 1.5 版本。它们能够生成各种风格的图像，并且所需的计算能力和资源有限。

2.x 系列包括 2.0 和 2.1。该系列旨在创建高分辨率图像，并能够理解表达性和复杂的提示。

稳定扩散 XL 1.0 是最常用的开源版本，它能够创建具有改进的色彩分级和构图的高分辨率图像。此外，此版本可以理解复杂的提示和概念。

稳定扩散 XL Turbo (SDXL Turbo) 是 SDXL 1.0 的扩展，旨在一步快速生成图像。

稳定扩散 3 是 Stability AI 于 2024 年 3 月发布的最新版本，在解释提示、图像质量和分辨率以及拼写能力等功能方面性能有所提升。该模型仍处于预览阶段，尚未公开发布。

下表总结了稳定扩散各个版本的特性和改进 -

特性	SD 1.5	SD 2.0	SD 2.1	SD XL 1.0
发布日期	2022 年 10 月	2022 年 11 月	2022 年 12 月	2023 年 7 月
分辨率	512x512	768x768	768x768	1024x1024
提示技术	OpenAI 的 CLIP Vit-L/14	LAION 的 OpenCLIP-ViT/H	LAION 的 OpenCLIP-ViT/H	OpenCLIP-ViT/G 和 CLIP-ViT/L
优势	初学者友好，在风景和建筑主题方面表现更好	改进对复杂提示的处理和解释，更好的图像分辨率	改进的概念理解，更好的色彩分级和图像质量	更好的肖像，高分辨率和图像质量，更短的提示
限制	提示解释能力较差	生成方面更具限制性，NSFW 过滤	更“审查”，尤其是在生成名人形象和艺术风格时。	需要计算资源才能在本地运行

打印页面