稳定扩散 XL



稳定扩散 XL 1.0 是文本到图像生成模型发展中的一个重大进步。这个版本是 Stability AI 的旗舰模型,经过改进,成为世界上最好的图像生成模型,其后续版本 SDXL 0.9 仅限于研究用途发布。本章探讨了稳定扩散 XL (SDXL) 1.0 的功能、访问方式和局限性。

稳定扩散 XL 的功能

根据报道,当 Stability AI 将 SDXL 1.0 与其他各种模型进行测试时,结果明确表明,人们更喜欢这个模型而不是其他版本。该版本提供的一些关键功能包括:

  • 上下文理解 - 一个显著的改进是模型理解和解释复杂提示的能力。
  • 清晰的文本 - 该模型还专注于生成准确清晰的文本,即图像上的文本。
  • 更好的肖像 - 虽然以前的模型在生成人物肖像和人体解剖方面存在问题,但这个模型在一定程度上解决了这个问题,生成了更高质量的肖像。
  • 艺术风格 - 稳定扩散 XL 提供各种艺术风格的图像生成,例如动漫、数字艺术、电影、3D 模型等。
  • 提示词 - 您不再需要提供冗长的提示词来获得理想的结果,SDXL 比以前的模型更好地理解简短的提示词。
  • 开源和色彩构成 - SDXL成为所有稳定扩散版本中最常用模型的原因是它是开源的,并且旨在生成高质量的图像以及更好的色彩分级和构图。

如何访问稳定扩散 XL?

有许多方法可以上手 SDXL 模型。访问和使用稳定扩散 XL 的四种主要方法是:

在线访问稳定扩散 XL 1.0

Clipdrop 是免费访问稳定扩散 XL 的最简单方法之一。访问其官方网站后,您可以键入提示词或从预先编写的示例中选择并生成图像。

使用 Discord 访问稳定扩散 XL 1.0

通过Discord访问也是生成图像的另一种最简单的方法。开始使用后,访问 #bot-1 - #bot-10 之间的任一频道,您将找到以下命令来输入提示词:"/dream prompt: *在此处输入提示词*"。输入提示词后,机器人将生成两张图像,您可以选择其中较好的一张,也有助于训练模型。

使用 Hugging Face 访问稳定扩散 XL 1.0

该模型目前可在Hugging Face上下载。点击此处下载SDXL 1.0 基础模型

稳定扩散 XL Turbo

SDXL 的下一个增强版本是稳定扩散 XL Turbo,它采用了一种名为对抗扩散蒸馏 (ADD) 的新蒸馏技术,允许模型一步生成图像。

您也可以通过在Hugging Face上下载模型权重和代码,或访问 Stability AI 的图像编辑平台Clipdrop来访问此模型。

稳定扩散 XL 的局限性

该模型有一些局限性,例如:

  • 它无法生成完美的逼真照片。
  • 它难以处理具有复杂提示的任务。
  • 它在生成肖像和人物方面也存在困难。
  • 它在生成清晰文本方面不够准确,但比以前的模型有所改进。
  • 由于模型的自动编码部分是有损的,因此在编码过程中可能会丢失信息。
广告