1. 前言
CVPR2018的文章。
在图片合成领域,GAN得到了非常多的应用。和传统的GAN拥有一个generator和一个discriminator,两者相互竞争不同,FaceID-GAN拥有三个player。如下图:
![](https://img.haomeiwen.com/i13613701/8e2745a718418e55.png)
多了一个player是classifier,它和generator竞争,来区分真是图片和合成图片的id。
2. 介绍
从上图中左图可以看出,传统的GAN包含了和
两个player,
用于产生合成图片,
用于区分真实图片和生成的图片。
但是在人脸领域中,仅仅产生一个看似真实的图片是不够的,我们期望产生的图片和原来的图片能够看着像同一个人。也就是identity-preserving 。为此
作者拓展了原来的GAN,增加了一个classifier,也就是。
将真实图片和生成图片作为输入,也就是
。之后预测它们的label:
。我们希望它们预测得到的label一样。
有一点需要注意的是,即使用于将真实图片的特征和生成图片的特征分为同一类,但是它并不具备将这两个特征变的非常接近的能力。如下图:
![](https://img.haomeiwen.com/i13613701/bb7906ab4cafeed2.png)
它做的仅仅是让和
的距离比
和其他的距离近而已。
因此,仅仅加一个分类器并不能保证identity preserve。为此作者提出了FaceID-GAN。让
和
竞争,和
合作。从上图的右图可以看出,FaceID-GAN不仅在id1和id2之间分类,而且在真实的id1和假的id1之间分类(通过使用2N个label)。在这种情况下,为了迷惑
,
生成的图片,在特征空间上,不仅仅要在正确的分类边界内,还必须尽可能地靠近真实的特征。
由于同时处理真实图片和生成图片,它比分别处理更加容易。
2. Previous work
-
one-to-one:
Figure 3 (a)
学习一对一的映射,例如:风格转换,高分辨率图片生成,从图片到草图的生成等。
-
many-to-one:
Figure 3 (b)
例如人脸的转正。
-
many-to-many:
Figure 3 (c)
-
FaceID-GAN:
Figure 3 (d)
3. Proposed Method
整体结构如下图:
![](https://img.haomeiwen.com/i13613701/f76e4fbdad1b0244.png)
从上图看出,
![](https://img.haomeiwen.com/i13613701/0781c41deca4e162.png)
其中,
![](https://img.haomeiwen.com/i13613701/c325dd2e3de9929b.png)
其中
![](https://img.haomeiwen.com/i13613701/2bbf67aa24f88ed9.png)
3.3 Shape Estimator P
作者使用3D Morphable Model(3DMM)来将人脸图片映射到shape feature space。
3.4 Generator G
![](https://img.haomeiwen.com/i13613701/be6e8fb8e70bfef4.png)
网友评论