生成对抗网络(GAN)是一种通过对抗训练生成逼真数据的深度学习模型,由Ian Goodfellow等人于2014年提出。其核心思想是让两个神经网络(生成器与判别器)在博弈中共同进步。其中生成器负责伪造数据(如图像、音频),试图欺骗判别器,判别器负责区分真实数据与生成数据。两者不断对抗优化,最终生成器可输出高度逼真的数据。
核心原理
1.对抗训练过程
生成器:输入随机噪声,输出生成数据。
判别器:输入真实数据或者生成数据,输出判别概率。
2.训练动态
判别器:最大化准确率(区分真假)。
生成器:最小化判别器的正确率(提升伪造能力)。
3.关键创新
无监督学习:无需标注数据,直接学习数据分布。
对抗性损失:替代传统均方误差(MSE),生成更锐利的结果。
GAN的经典变体
DCGAN:引入卷积层,稳定图像生成
WGAN:用 Wasserstein 距离替代 JS 散度,解决训练不稳定
CycleGAN:循环一致性损失,实现无配对图像转换
StyleGAN:分层风格控制,生成超逼真人脸
BigGAN:大规模训练,生成高质量多样化图像