使用 Python 和 OpenAI 生成图像
简介
在这个生成式 AI 越来越流行的世界里,使用 AI 生成图像也就不足为奇了。其中一种方法是使用流行的 OpenAI,也就是 ChatGPT 的创建者。开发人员、作家和设计师正在利用 ChatGPT API 来更快地完成工作。
因此,在本文中,我们将尝试了解 OpenAI 的 DALL-E,它可以用于生成图像。我们将用代码实现 ChatGPT API Python。
如何在 Python 中使用 OpenAI 生成图像?
要使用 OpenAI 生成图像并使用 Python 编辑图像,我们将不得不使用 OpenAI 的 DALL-E API。因此,DALL-E 是 OpenAI 的一项流行服务,它根据我们提供的提示生成逼真的图像。
遵循本教程所需的先决条件:
拥有 OpenAI 帐户,并有可用的积分来使用 API 密钥。
了解 Python 代码编写。
了解 API 的基本知识。
什么是 OpenAI 的 DALL-E?
在进入教程之前,至少需要稍微了解一下我们将要使用的生成式 AI 服务。
DALL·E 是 OpenAI 用于生成图像的 AI 模型。它可以根据自然语言提示创建逼真的图像和艺术作品。它基于神经网络和潜在扩散模型 (LDM) 的研究。这使得它能够根据人类提供的提示生成图像。
该系统使用 GPT-3 模型的修改版本。对于那些不知道的人,OpenAI GPT-3 是 OpenAI 广为人知的语言模型。
DALL-E 可以解释人类生成的输入并生成所需的图像。因为它在训练过程中经历了海量的图像-文本对数据集。DALL·E 学会将文本描述与视觉概念联系起来。这使其能够生成与给定提示匹配的图像。
设置您的环境
为了开始 Python 代码的实现,首先我们需要在 Python 中设置 API 密钥和环境。之后,继续编写 Python 代码并通过我们的提示完成图像生成。
以下是使用 Python 中的 OpenAI 生成图像需要遵循的步骤。
步骤 1 - OpenAI 帐户和 API 密钥
如果您已经有 OpenAI 帐户,请登录您的帐户并点击右上角的个人资料图标。您会找到“查看 API 密钥”,然后点击“创建新的密钥”并在此处创建一个。如果您没有帐户,请使用您选择的任何注册方法创建一个帐户,然后按照相同的步骤操作。
创建新的密钥后,复制此密钥并将其保存到您选择的位置。
步骤 2 - 安装 OpenAI 库。
检查 Python 版本以确保您的 Python 版本为 3.7.1 或更高版本。
python --version
在您的系统上创建 Python 环境。
在 Windows 中 -
PS> python -m venv venv PS> .\venv\Scripts\activate
在 Linux/MacOS 中
$ python -m venv venv $ source venv/bin/activate
使用 pip 安装 OpenAI 库。
python -m pip install openai
步骤 3 - 使用 API 密钥设置环境。
现在您已安装 OpenAI Python 库,您需要使用 API 密钥设置您的环境。为此,您可以使用环境变量来存储您的 API 密钥。这将使您的 Python 脚本能够使用它。
在 Windows 中 -
(venv) PS> $ENV:OPENAI_API_KEY = "<your-key-value-here>"
在 Linux/MacOS 中 -
(venv) $ export OPENAI_API_KEY="<your-key-value-here>"
将“<your-key-value-here>”替换为您之前存储的 API 密钥。
我们的 Python 环境现已设置,我们的 API 密钥也已准备就绪。现在是时候使用 DALL-E 在 Python 中生成图像了。
在 Python 中使用 DALL·E 进行图像生成
在深入了解使用 DALL-E 在 Python 中生成图像的实际代码之前,让我们先了解一下 DALL-E 的图像生成定价模型。
DALL-E 每张图像的定价
OpenAI 根据生成的图像分辨率对每次图像生成进行定价。下表总结了每种分辨率的每图像定价。
| 分辨率 | 每张图像的价格 |
|---|---|
| 256×256 | $0.016 |
| 512×512 | $0.018 |
| 1024×1024 | $0.020 |
但是……不要被这些价格吓到。为什么?因为,如果您最近在 OpenAI 平台上注册,那么它会在前 3 个月提供 18 个积分的免费试用。不过,这可能会限制生成的图像分辨率。
使用 Python 中的 OpenAI 生成图像
在下面的代码中,我们将导入 OpenAI 库,并将 API 密钥存储在环境变量中。我们将使用 OpenAI 库的 Image.create() 函数来存储响应,该响应将接受用户调用的用户生成的提示。
文件名 - image-creator.py
import openai openai.api_key = "YOUR_API_KEY" PROMPT = "Clean image of Harley Quinn imagined as a duck" response = openai.Image.create( prompt=PROMPT, n=1, size="256x256", ) print(response["data"][0]["url"])
在此代码中,您需要将“YOUR_API_KEY”替换为您之前存储的密钥。您还可以更改“size”变量中的图像分辨率。您可以调整“n”参数以更改要为您的提示生成的图像数量。您也可以在变量中添加您自己的提示。
要查看输出,请在您的终端中运行 Python 文件:
python image-creator.py
输出
我们对模型提供的提示的输出:
结论
恭喜!您已成功学习了如何通过 Python 中的 OpenAI API 使用 OpenAI 的 DALL·E 2 生成图像。凭借这些知识,您可以探索许多创意可能性,并在您的应用程序中使用 AI 生成的图像,以满足各种用例。尽情体验 DALL-E 及其惊人的图像生成功能吧!
数据结构
网络
关系数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP