PRNet：Joint 3D Face Reconstructi

作者: 魔法少女玛格姬 | 来源:发表于2018-08-16 18:05 被阅读0次

PRNet：Joint 3D Face Reconstructi
人脸对齐算法PRNet-（Joint 3D Face Recon
MTCNN
Python MTCNN（人脸检测）项目附代码讲解(1)-原理与
Joint Face Detection and Alignme
Joint Face Detection and Alignme
Joint Face Detection and Facial
CenterFace: Joint Face Detection
3D Scanning 扫描成像技术
3D Morphable Model

这篇发表于是ECCV2018，利用神经网络直接预测了3D landmark，取得了不错的效果

2D face alignment技术已经比较成熟，3D face reconstruction和3D face alignment一直是一个热点问题。目前普遍的方法是基于3DMM或者3D face template，但是本文不需要3DMM系数或者TPS扭曲参数，直接通过神经网络，建立从2D图片到3D模版的映射关系，效率很高。

项目地址：https://github.com/YadiraF/PRNet

平台：tensorflow

训练数据集：300W-Large Pose Face Alignment，97967张图片用于训练，24483张图片用于测试，训练集和测试集无重叠。该数据集包含了从正负5度到90度的多Pose人脸以及3D landmark。

一、如何建立2D人脸和3D人脸的映射关系？

这篇文章提出用UV position map来表现3D Face。 UV position map，记录UV空间中所有点的3D位置。如下图左所示， 3D空间的原点与输入图像的左上方重叠，正x轴指向图像的右侧。当投影到x-y平面时，地面实况3D面部点云与2D图像中的面部精确匹配。因此，我们可以很容易地理解我们的位置图，即用x，y，z坐标替换纹理贴图中的r，g，b值。

2D人脸与3D模型的映射关系

右图第一行分别表示，输入的2D图片，UV texture map，UV position map。

第二行分别表示，UV position map的x，y，z通道。

二、网络结构和Loss Function？

这篇文章的网络结构很简单，就是一个Encoder-Decoder结构。该文章的Encoder包含10个Residual blocks，输入是256x256x3的RGB图片，经过5次下采样得到了8x8x512的特征图。Decoder据说有17个transposed convolution layers，经过5次上采样得到了256x256x3的position map。

这篇文章采用了MSE Loss（Mean Square Error），来计算预测的position map与ground truth的差距。