稳定扩散 - 模型版本



自发布以来,稳定扩散模型经历了重大改进,每个版本都积累了之前版本的经验教训。本章比较了稳定扩散各个版本的功能。

稳定扩散 1.x

第一代稳定扩散模型,称为 1.x 系列,包括 1.1、1.2、1.3、1.4 和 1.5 版本。它们能够生成各种风格的图像,并且所需的计算能力和资源有限。

稳定扩散 2.x

2.x 系列包括 2.0 和 2.1。该系列旨在创建高分辨率图像,并能够理解表达性和复杂的提示。

稳定扩散 XL 1.0

稳定扩散 XL 1.0 是最常用的开源版本,它能够创建具有改进的色彩分级和构图的高分辨率图像。此外,此版本可以理解复杂的提示和概念。

稳定扩散 XL Turbo (SDXL Turbo) 是 SDXL 1.0 的扩展,旨在一步快速生成图像。

稳定扩散 3

稳定扩散 3 是 Stability AI 于 2024 年 3 月发布的最新版本,在解释提示、图像质量和分辨率以及拼写能力等功能方面性能有所提升。该模型仍处于预览阶段,尚未公开发布。

比较稳定扩散模型

下表总结了稳定扩散各个版本的特性和改进 -

特性 SD 1.5 SD 2.0 SD 2.1 SD XL 1.0
发布日期 2022 年 10 月 2022 年 11 月 2022 年 12 月 2023 年 7 月
分辨率 512x512 768x768 768x768 1024x1024
提示技术 OpenAI 的 CLIP Vit-L/14 LAION 的 OpenCLIP-ViT/H LAION 的 OpenCLIP-ViT/H OpenCLIP-ViT/G 和 CLIP-ViT/L
优势 初学者友好,在风景和建筑主题方面表现更好 改进对复杂提示的处理和解释,更好的图像分辨率 改进的概念理解,更好的色彩分级和图像质量 更好的肖像,高分辨率和图像质量,更短的提示
限制 提示解释能力较差 生成方面更具限制性,NSFW 过滤 更“审查”,尤其是在生成名人形象和艺术风格时。 需要计算资源才能在本地运行
广告