使用 Python 和 OpenAI 生成图像


简介

在这个生成式 AI 越来越流行的世界里,使用 AI 生成图像也就不足为奇了。其中一种方法是使用流行的 OpenAI,也就是 ChatGPT 的创建者。开发人员、作家和设计师正在利用 ChatGPT API 来更快地完成工作。

因此,在本文中,我们将尝试了解 OpenAI 的 DALL-E,它可以用于生成图像。我们将用代码实现 ChatGPT API Python。

如何在 Python 中使用 OpenAI 生成图像?

要使用 OpenAI 生成图像并使用 Python 编辑图像,我们将不得不使用 OpenAI 的 DALL-E API。因此,DALL-E 是 OpenAI 的一项流行服务,它根据我们提供的提示生成逼真的图像。

遵循本教程所需的先决条件:

  • 拥有 OpenAI 帐户,并有可用的积分来使用 API 密钥。

  • 了解 Python 代码编写。

  • 了解 API 的基本知识。

什么是 OpenAI 的 DALL-E?

在进入教程之前,至少需要稍微了解一下我们将要使用的生成式 AI 服务。

DALL·E 是 OpenAI 用于生成图像的 AI 模型。它可以根据自然语言提示创建逼真的图像和艺术作品。它基于神经网络和潜在扩散模型 (LDM) 的研究。这使得它能够根据人类提供的提示生成图像。

该系统使用 GPT-3 模型的修改版本。对于那些不知道的人,OpenAI GPT-3 是 OpenAI 广为人知的语言模型。

DALL-E 可以解释人类生成的输入并生成所需的图像。因为它在训练过程中经历了海量的图像-文本对数据集。DALL·E 学会将文本描述与视觉概念联系起来。这使其能够生成与给定提示匹配的图像。

设置您的环境

为了开始 Python 代码的实现,首先我们需要在 Python 中设置 API 密钥和环境。之后,继续编写 Python 代码并通过我们的提示完成图像生成。

以下是使用 Python 中的 OpenAI 生成图像需要遵循的步骤。

步骤 1 - OpenAI 帐户和 API 密钥

  • 如果您已经有 OpenAI 帐户,请登录您的帐户并点击右上角的个人资料图标。您会找到“查看 API 密钥”,然后点击“创建新的密钥”并在此处创建一个。如果您没有帐户,请使用您选择的任何注册方法创建一个帐户,然后按照相同的步骤操作。

  • 创建新的密钥后,复制此密钥并将其保存到您选择的位置。

步骤 2 - 安装 OpenAI 库。

  • 检查 Python 版本以确保您的 Python 版本为 3.7.1 或更高版本。

python --version
  • 在您的系统上创建 Python 环境。

在 Windows 中 -

PS> python -m venv venv
PS> .\venv\Scripts\activate

在 Linux/MacOS 中

$ python -m venv venv
$ source venv/bin/activate
  • 使用 pip 安装 OpenAI 库。

python -m pip install openai

步骤 3 - 使用 API 密钥设置环境。

现在您已安装 OpenAI Python 库,您需要使用 API 密钥设置您的环境。为此,您可以使用环境变量来存储您的 API 密钥。这将使您的 Python 脚本能够使用它。

在 Windows 中 -

(venv) PS> $ENV:OPENAI_API_KEY = "<your-key-value-here>"

在 Linux/MacOS 中 -

(venv) $ export OPENAI_API_KEY="<your-key-value-here>"

将“<your-key-value-here>”替换为您之前存储的 API 密钥。

我们的 Python 环境现已设置,我们的 API 密钥也已准备就绪。现在是时候使用 DALL-E 在 Python 中生成图像了。

在 Python 中使用 DALL·E 进行图像生成

在深入了解使用 DALL-E 在 Python 中生成图像的实际代码之前,让我们先了解一下 DALL-E 的图像生成定价模型。

DALL-E 每张图像的定价

OpenAI 根据生成的图像分辨率对每次图像生成进行定价。下表总结了每种分辨率的每图像定价。

分辨率 每张图像的价格
256×256 $0.016
512×512 $0.018
1024×1024 $0.020

但是……不要被这些价格吓到。为什么?因为,如果您最近在 OpenAI 平台上注册,那么它会在前 3 个月提供 18 个积分的免费试用。不过,这可能会限制生成的图像分辨率。

使用 Python 中的 OpenAI 生成图像

在下面的代码中,我们将导入 OpenAI 库,并将 API 密钥存储在环境变量中。我们将使用 OpenAI 库的 Image.create() 函数来存储响应,该响应将接受用户调用的用户生成的提示。

文件名 - image-creator.py

import openai

openai.api_key = "YOUR_API_KEY"

PROMPT = "Clean image of Harley Quinn imagined as a duck"

response = openai.Image.create(
   prompt=PROMPT,
   n=1,
   size="256x256",
)

print(response["data"][0]["url"])

在此代码中,您需要将“YOUR_API_KEY”替换为您之前存储的密钥。您还可以更改“size”变量中的图像分辨率。您可以调整“n”参数以更改要为您的提示生成的图像数量。您也可以在变量中添加您自己的提示。

要查看输出,请在您的终端中运行 Python 文件:

python image-creator.py

输出

我们对模型提供的提示的输出:

结论

恭喜!您已成功学习了如何通过 Python 中的 OpenAI API 使用 OpenAI 的 DALL·E 2 生成图像。凭借这些知识,您可以探索许多创意可能性,并在您的应用程序中使用 AI 生成的图像,以满足各种用例。尽情体验 DALL-E 及其惊人的图像生成功能吧!

更新于:2024年1月23日

138 次浏览

启动您的 职业生涯

通过完成课程获得认证

开始
广告
© . All rights reserved.