认真学习师姐的CVPR论文。
核心
MSGAN主要是提出了一个正则项,目的在于最大化生成的数据分布与隐编码分布的比值,即在隐编码z变化较小的时,网络的输出能够变化较大(映射到不同的数据分布上)。
优势
- 好处在于可以在同一个输入与condition的情况下,增加latent z后,不同的z能够输出不同的、有意义的、符合条件的输出。极大的增强了输出的Diversity。实质上解决了应用GAN训练时常见的模式坍塌问题(只学到较少的几个数据分布,网络作弊行为),实现了cGANs的多模态。
-
能够有效的应用到当前提出的cGAN应用形态,只需将正则项加入到损失函数中训练即可,通用性极强。
模式分布形象化展示
亮点
- 对当前cGANs的主流重要应用准确概括分类,并做实验验证提出的模式寻找正则项在其上的适用性,使结果具有很强的说服力。
- 对模式坍塌问题的表现形式,提出的解决方案做了清晰的解释与分类概括。
- 实验结果评价比较用了多个典型指标
- 文献引用非常准确,均为对应领域的典型工作。
反思
- 老师:假如你研究发现1+2=3,那下一步就是研究出a+b=c的问题,那就是一个很好的工作。要慢慢学会抽象问题与结论的本质。
- 精读重要论文要问自己几个问题:主要解决了什么问题?用了什么方法?为什么会效果好?
- 设计实验时注重完备性、对照性、公平性。
- 师姐:会讲故事和包装故事应该是每个reseacher的基本素养,但是有深度有意义的工作才是最重要的。
加油吖 :)
网友评论