
在图片输入到神经网络前需要进行有些必要预处理工作。

减去均值:均值向量(3 X 1,为每个颜色通道的均值)是所有训练图像上像素值的均值,并且在测试阶段也从输入图像中减去图像。
重新缩放:这里会考虑两个参数分别是目标尺寸和最大尺寸。将图片的较短的边(宽或高)调整为目标尺寸,然后保持长宽比例来调整较长边 (宽或高),以保持长宽比不变。但是,如果调整后较长边(宽或高)超过了最大尺寸,则需要将该边的尺寸调整为最大尺寸,并根据原始长宽比例来调整较短边(宽或高),从而保持长宽比不变。目标大小和最大大小的默认值分别为 800 和 1333。
边缘填充:因为使用 FPN,所以边缘填充是必要的。 所有填充仅在最右边和最底端的边缘,因此目标坐标不会受到影响,坐标系是从最左上角开始的。 如果不使用 FPN,则无需执行此步骤。

图片宽度为最小边 (600) ,将其重新缩放为 800 后,另一个高尺寸根据宽高比例调整大小得到新的高为(1200),但是 1200 不是 32 的倍数,需要对其进行填充为使得结果大小为 32 倍数(1216/32 = 38)。
注意:用于锚点生成和卷积步骤的图像高度和宽度将被视为调整大小后的图像,而不是填充后的高度。
网友评论