DCGAN: Deep Convolutional Genera

作者: 山雾幻华 | 来源:发表于2020-02-12 23:11 被阅读0次

[toc]

1. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

arXiv:1511.06434 [cs]
tensorflow2代码：https://github.com/zhangkaihua88/ML_Paper

总结

提出并评估了一系列卷积GAN体系结构拓扑上的约束条件，这些约束条件使得它们在大多数情况下可以稳定地训练。我们将这种架构称为Deep Convolutional GANs（DCGAN）
使用图像分类任务上训练出来的判别器和其他的非监督算法做了比较
对GAN学习到的特征做出了可视化，并经验性的证明了特殊的特征表征了特殊的对象
针对生成器，我们提出了一个很有趣的算法向量，这个向量能很简单的在语义层面上操作生成样例的质量

全卷积网络
使用逐步卷积替代确定性的空间池化函数,允许网络学习自身上采样(upsampling)或下采样(downsampling)方式（生成器G/判别器D）。在网络中，所有的pooling层使用步幅卷积(判别网络)和微步幅度卷积(生成网络)进行替换。
在卷积特征之上消除全连接层
例如全局平均池化，全局平均pooling增强了模型稳定性，但减缓了收敛速度
批量归一化(Batch Normalization)
将每个单元的输入都标准化为0均值与单位方差
- 改进了训练问题
- 缓解了深层网络中的梯度溢出问题
但实际上，这种方法在深层的生成器中被证明是不适用的，它会导致生成器反复震荡生成单点数据。但是，将所有层都进行BN，会导致样本震荡和模型不稳定，所以，不要在生成器的输出层和判别器的输入层上使用BN。
激活函数
生成器：除了最终输出层使用Tanh，其他都使用Relu
判别器：都是用leaky relu(leaky rectified activation)

稳定DCGAN的架构指导：

判别器的网络构造

20200212214025.png
常用验证unsupervised representation learning algorithms 的方法是：
选择某个监督学习数据集，使用训练好的模型输入数据提取特征，使用线性模型用于监督数据集任务，查看性能。

本文标题：DCGAN: Deep Convolutional Genera

本文链接：https://www.haomeiwen.com/subject/euuhfhtx.html