摘要
在DeepPrior上做了改进:1. 基础网络结构换成ResNet;2. 改进手部定位网络; 3. 数据增强
关键
-
训练数据增强
-
旋转
-
放缩
-
平移
-
Online Augmentation
在训练时对输入图片做上述(旋转,缩放,平移)操作,保证每个epoch模型看到的都是不完全相同的输入。这能很好的提升鲁棒性。
-
更加鲁棒的先验
使用增强的数据PCA初始化瓶颈层
-
-
手部定位网络
DeepPrior默认手部即距离摄像头最近的物体,从而截取出手部区域。本文在DeepPrior基础上,应用CNN回归预测中指的掌指关节点用于修正边界框。
![](https://img.haomeiwen.com/i1013002/26d44f8a7cfc2031.png)
- 基础网络结构
![](https://img.haomeiwen.com/i1013002/958e4bb0ef0b9139.png)
取消平均池化,加入两个全连接层
结果
![](https://img.haomeiwen.com/i1013002/767d88f0e67a3e78.png)
相较于DeepPrior有不错改善
网友评论