深度卷积网络自身拥有强大的表达能力,不过正因如此,网络本身需至海量数据来驱动模型训练,否则便有极大可能陷入过拟合的窘境。
因此,在实践中数据扩充便成为深度学习的第一步。有效的数据扩充不仅能扩充训练样本数量,还能增加训练样本的多样性,一方面可避免过拟合,另一方面又会带来模型性能的提升。
简单数据扩充
数据扩充的几种常用方法:图像水平翻转、随机抠取、尺度变换和旋转。
除此,其他简单的数据扩充方式还有尺度变换、旋转等,从而增加卷积神经网络对物体尺度和方向上的鲁棒性。尺度变换一般是将像分辨率变为原图的0.8,0.9,1.1,1.2,1.3等倍数,将尺度变换后的图像作为扩充的训练样本加入原训练集。旋转操作类似,将原图旋转一定角度,同样将旋转变换的图像作为扩充样本加入模型训练。
特殊的数据扩充
Fancy PCA
对训练数据的R,G,B像素值进行主成分分析,得到对应特征向量pi 和特征值 λi (i = 1, 2, 3),然后根据特征向量和特征值可以计算一组随机值[p1, p2, p3] [α1λ1, α2λ2, α3λ3]⊤,将其作为扰动加到原像素值中即可。
监督式数据扩充
以上提及的简单数据扩充方法均直接作用于原图,且并未借助任何图像标注信息。国内海康威视种监督式——利用图像标记信息——的新型数据扩充方式。
对此,可首先训练一个初初始分类器,对该图生成对应的特征图或热力图。这张特征图可指示图像区域与场景
标记间的相关概率。之后,可根据此概率映射回原图选择较强相关的图像区域作为扣取的图像块。
网友评论