生成模型类型



生成模型近年来获得了极大的关注。这些创新的算法主要用于无监督学习,擅长处理数据的底层分布并生成复杂的输出,例如图像、音乐和自然语言,这些输出与原始训练数据相当。

阅读本章,探索三种突出且最广泛使用的生成模型类型:生成对抗网络(GANs)、自动编码器变分自动编码器(VAEs)

生成对抗网络(GANs)

生成对抗网络(GANs)由Ian Goodfellow及其团队于2014年提出。GANs是一种生成建模方法,它基于深度神经网络架构,生成看起来像原始训练数据的新复杂输出。GAN框架包含两个神经网络——“生成器”和“判别器”。

GANs的工作原理

让我们借助下图了解GAN模型的工作原理:

Generative Models Types 1

如图所示,GANs有两个主要组成部分:生成器网络判别器网络

该过程从向生成器提供一个随机种子/噪声向量开始。现在,生成器使用此输入创建新的合成样本。然后,将这些生成的样本以及提供的真实数据样本提供给判别器网络。

然后,判别器网络评估这些样本的真实性,即样本是真实的还是伪造的。最后,判别器通过反向传播调整生成器的参数,从而对生成器的输出提供反馈。

然后,生成器和判别器继续学习并相互适应,直到生成器生成能够欺骗判别器的非常真实的样本。

GANs的应用

生成对抗网络(GANs)在各个领域都有应用。事实上,OpenAI开发的特定模型DALL-E结合了GANs和Transformer的思想,根据文本描述生成图像。

GANs的其他一些应用包括:

  • 图像生成
  • 数据增强
  • 文本到图像合成
  • 视频生成和预测
  • 异常检测
  • 人脸衰老和返老还童
  • 风格迁移和图像编辑

自动编码器

另一种广泛使用的生成模型彻底改变了从计算机视觉到自然语言处理的各个领域,这就是自动编码器

自动编码器是一种人工神经网络(ANN),旨在以无监督的方式学习数据编码。传统的神经网络用于监督学习任务,如分类和回归,将输入数据映射到相应的输出标签。另一方面,自动编码器通过将高维输入数据解码为低维表示来学习重建输入数据。

自动编码器的架构

自动编码器的架构由三个主要部分组成:

  • 编码器 - 它通过将输入数据映射到低维表示来压缩信息为密集编码。
  • 瓶颈层(潜在空间) - 在此层中,潜在空间表示以压缩形式捕获输入数据的基本特征。
  • 解码器 - 它通过重建压缩表示来将其解压缩回原始输入空间。此模块的主要目标是最小化重建误差。
Generative Models Types 2

自动编码器的应用

以下是自动编码器的一些应用:

  • 图像压缩和重建
  • 特征学习和表示
  • 异常检测
  • 降维
  • 自然语言处理

变分自动编码器

变分自动编码器(VAEs)是一类生成模型,其基础是我们上面学习的自动编码器的概念。

传统的自动编码器学习输入和潜在空间表示之间的确定性映射。另一方面,VAEs生成潜在空间中概率分布的参数。此功能使VAEs能够捕获输入数据样本的底层概率分布。

VAEs的架构和组件

与自动编码器一样,VAEs的架构也包含两个主要组件:编码器和解码器。在VAEs中,编码器而不是像自动编码器那样使用确定性映射,而是提出将概率建模引入潜在空间。

以下是VAEs的关键组件:

  • 编码器 - 它将输入数据样本映射到潜在空间中概率分布的参数。映射后,编码器给出每个数据点的均值和方差向量。
  • 潜在空间 - 此组件表示编码器学习的输入样本数据的概率。
  • 解码器 - 它通过使用来自潜在空间的样本重建数据样本。解码器的目的是匹配输入数据分布。

变分自动编码器(VAEs)的应用

变分自动编码器(VAEs)像自动编码器一样在各个领域都有应用。其中一些列在下文:

  • 图像生成
  • 数据可视化
  • 特征学习
  • 异常检测
  • 自然语言处理

在后续章节中,我们将详细讨论这些突出且最广泛使用的生成模型类型。

结论

在本章中,我们概述了三种最广泛使用的生成模型,即生成对抗网络(GANs)、自动编码器和变分自动编码器(VAEs)。它们独特的性能推动了生成建模的进步。

GANs凭借其对抗性训练框架,可以生成看起来像原始训练数据的新复杂输出。我们讨论了GANs使用其由两个神经网络组成的框架的工作原理:生成器判别器

另一方面,自动编码器旨在以无监督的方式学习数据编码。它们通过将高维输入数据解码为低维表示来重建输入数据。

变分自动编码器(VAEs)引入了概率潜在空间表示。它们通过捕获样本输入数据的底层概率分布,弥合了自动编码器和概率建模之间的差距。

无论是生成逼真的图像、学习数据的有意义表示,还是探索概率潜在空间表示,GANs、自动编码器和VAEs都在塑造着人工智能驱动的生成技术的未来。

广告