OpenAI 的Sora：它是什麽，它是如何工作的，以及其用例

人工智能的兴起始于ChatGPT的开发，这是一种基于提示提供文本信息的生成模型。该模型吸引了所有人对生成式人工智能的关注。接下来是基于文本提示和图像的图像生成。人工智能领域的新时代革命是开发了一种基于用户提供的描述生成视频的模型。

什么是 OpenAI Sora？

OpenAI Sora 是 OpenAI 开发的一种人工智能模型，它可以根据用户提供的文本描述创建逼真且富有创意的视频。其主要目标是生成物理运动，以解决需要实时交互的问题。

这款文本转视频模型于2024 年 2 月发布。该工具目前尚未公开发布。OpenAI 正在采取措施防止生成有害和误导性内容。

OpenAI Sora 是生成式 AI 和多模态 AI 的一次革命。虽然它尚未公开发布，但其网站上提到的模型的一些功能包括：

OpenAI Sora 的能力可以应用于各种创意和实践领域：

目前，OpenAI Sora 尚未公开发布。只有红队成员可以访问它以评估风险和危害。OpenAI 还向一些平面设计师和视觉艺术家提供了访问权限，以评估模型的效率并获得改进反馈。

OpenAI Sora 的工作原理与大型语言模型 (LLM) 非常相似，其中模型是在互联网规模的数据上进行训练的。虽然 LLM 具有文本标记，但 Sora 具有视觉块。将视频输入模型，通过将视频压缩到较低维度的潜在空间，然后将其分解成时空块来将视频转换成块。

团队正在改进的当前模型仍有改进空间。OpenAI 提到的某些限制包括：

使用 AI 生成视频的这一最新想法展示了 AI 在不同领域的快速应用。最终，该工具的设计是为了应用于医疗保健和其他领域。此外，可能会有公司站出来开发利用 AI 来改善人类生活的工具。

OpenAI Sora 是 AI 领域的最新创新。该工具由 OpenAI 开发，可以根据文本描述生成视频。它很快就会向公众开放，这将改变各个行业中某些工作的效率。特别是商业营销和广告、电影制作和故事讲述。当然，它可能与真实的视频不一样。

Sumana Challa

更新于：2024 年 9 月 12 日

112 次浏览

通过完成课程获得认证

开始