您的位置:首页 > 房产 > 建筑 > h5在线_新开三端互通传奇网站_学校seo推广培训班_如何制作微信小程序店铺

h5在线_新开三端互通传奇网站_学校seo推广培训班_如何制作微信小程序店铺

2025/1/27 13:22:30 来源:https://blog.csdn.net/alovelypeach/article/details/144314795  浏览:    关键词:h5在线_新开三端互通传奇网站_学校seo推广培训班_如何制作微信小程序店铺
h5在线_新开三端互通传奇网站_学校seo推广培训班_如何制作微信小程序店铺

GAN(生成对抗网络)原理与目标函数

什么是 GAN?

GAN 是一种生成模型,全名是 生成对抗网络 (Generative Adversarial Network)。它由两个部分组成:

  • 生成器 (Generator, G):负责生成“假数据”。
  • 判别器 (Discriminator, D):负责判断输入的数据是真实数据还是生成器生成的假数据。

这两部分通过一种对抗的方式互相竞争,最终生成器会变得越来越“聪明”,能够生成接近真实的数据。


GAN 的基本思路

GAN 就像一个“造假者”和一个“鉴定师”之间的对抗游戏:

  • 生成器 G:试图生成“看起来像真的”数据,欺骗判别器。
  • 判别器 D:试图识别哪些数据是真实数据,哪些是生成器生成的“假数据”。

GAN 的目标

  • 生成器的目标:让判别器无法分辨出生成的数据是假的。
  • 判别器的目标:尽可能准确地区分真实数据和生成数据。

这种对抗的训练过程会让生成器越来越优秀,最终它生成的数据会逐渐接近真实数据的分布。


GAN 的训练过程

GAN 的训练过程可以分为以下几个步骤:

  1. 初始化

    • 给生成器和判别器随机分配初始的参数。
    • 定义一个简单的潜在分布 ( P_z )(比如一个标准正态分布 ( z \sim N(0, 1) )),生成器将从这个分布中采样。
  2. 训练判别器 D

    • 判别器接收两种数据:
      1. 真实数据 ( r \sim P_r )(从真实数据分布中采样)。
      2. 生成器生成的假数据 ( g \sim P_g )(从生成器生成的数据分布中采样)。
    • 判别器的目标是最大化它对真实数据的预测概率,同时最小化它对生成数据的预测概率。
  3. 训练生成器 G

    • 生成器的目标是生成能骗过判别器的数据,也就是说,它希望判别器把生成数据也认为是真实的。
    • 生成器通过判别器的反馈不断调整自己的参数,逐渐生成更真实的数据。
  4. 重复上述过程

    • 不断交替训练 G 和 D,直到生成器生成的数据足够接近真实数据。

GAN 的目标函数

GAN 的目标函数可以表示为一个最小-最大问题:

[
\min_G \max_D V(G, D) = \mathbb{E}{r \sim P_r}[\log D®] + \mathbb{E}{z \sim P_z}[\log(1 - D(G(z)))]
]

目标函数分解理解

  1. 判别器的目标
    判别器希望最大化:
    [
    V(D) = \mathbb{E}{r \sim P_r}[\log D®] + \mathbb{E}{z \sim P_z}[\log(1 - D(G(z)))]
    ]

    • 第一项 ( \mathbb{E}_{r \sim P_r}[\log D®] ):表示判别器对真实数据的预测准确性。
    • 第二项 ( \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))] ):表示判别器对生成数据识别为假的准确性。
  2. 生成器的目标
    生成器希望最小化:
    [
    V(G) = \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))]
    ]

    • 生成器的目标是生成能让 ( D(G(z)) ) 尽可能接近 ( 1 ) 的数据,从而骗过判别器。
  3. 最小-最大博弈

    • 判别器 ( D ) 希望最大化目标函数。
    • 生成器 ( G ) 希望最小化目标函数。
    • 这种对抗的关系让它们互相推动,最终生成器会变得越来越强,能够生成接近真实分布的数据。

GAN 的原理总结

  • GAN 是一个博弈过程,生成器和判别器互相竞争。
  • 生成器通过学习真实数据分布 ( P_r ),从一个简单的潜在分布 ( P_z ) 中采样,然后生成接近 ( P_r ) 的数据。
  • 判别器的任务是区分真实数据和生成数据,而生成器的任务是尽量骗过判别器。
  • GAN 的训练目标是让生成器生成的数据分布 ( P_g ) 无限接近于真实数据分布 ( P_r )。

举个例子

假设我们用 GAN 来生成“假钞”:

  • 生成器 G:是一个“造假者”,它尝试生成看起来像真的钞票。
  • 判别器 D:是一个“验钞机”,它试图判断钞票是真钞还是假钞。
  • 在训练过程中:
    • 生成器不断改进它的造假技术,让验钞机无法分辨钞票的真假。
    • 验钞机也不断提高识别能力,更好地区分真假钞票。
  • 最终,生成器变得非常强大,能够生成完全无法区分的“假钞”。

GAN 的挑战

虽然 GAN 很强大,但也有一些挑战:

  1. 不稳定性

    • GAN 的训练过程是一个动态博弈,可能会导致不收敛或者模式崩塌。
  2. 模式崩塌 (Mode Collapse)

    • 生成器可能只生成一部分样本,忽略了真实数据分布的多样性。
  3. 训练难度

    • 需要小心调整超参数,保证生成器和判别器的能力均衡。

GAN 的应用

GAN 的应用非常广泛,包括但不限于:

  • 图像生成(如生成高清人脸图片)。
  • 图像修复(修补损坏的图像)。
  • 图像风格迁移(如将照片变成油画风格)。
  • 数据增强(生成更多样本用于训练)。
  • 视频生成、语音合成等。

R1 正则项

R1 正则项是一种通过对判别器的梯度进行惩罚的方法,用于鼓励判别器将生成器生成的图像与真实图像区分开来。

具体来说,在 R1 正则项中,我们首先计算判别器对真实图像的预测结果,并求出其对输入图像的梯度。然后,我们计算这些梯度的平方,并对它们进行求和,最后取平均值。这个平均值就是 R1 正则项,用于对判别器的预测结果进行惩罚。对于生成器的输出,我们同样可以对其进行类似的处理,得到对应的 R1 正则项。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com