感受野:表示网络内部的某个神经单元对应原图像的大小
感受野大小的作用:
神经元的值一般是由感受野的那些数据通过卷积,maxpooling等操作得到的,所以:
- 感受野越大,它对应的原始图像的范围就越大,也就意味着它可能蕴含更为全局的,语义层次更高的特征
- 感受野越大,它对应的原始图像的范围就越小,也就意味着它包含的特征更加趋近于局部和细节
感受野的例子:
原始图像为7*7,在conv1层,filter为3*3,stride为2,一个77的图像经过conv1处理后得到了一个3*3的feature map,然后利用一个filter=2*2,stride=1的conv2层去处理feature map,得到了一个22的feature map,运算的过程可以稍微推导可得。卷积的尺寸公式如下式:
下面我们来看conv1中蓝色圈中3对应的感受野,显然这个3是又原始图像的蓝色框中3*3的矩阵和一个3*3的filter运算得到的,那我们可以知道其对应的原始图像的面积即为3*3的一个矩阵,那么其感受野为3*3
再来看conv2中黑色的框中5对应的感受野,这个5是由conv1中黄色框中一个2*2的矩阵和一个2*2的filter运算得到的,其中4个3分别是原始图像中蓝色,绿色,红色,紫色4个3*3的矩阵运算得到的,那么可以看到为了得到conv1中黄色的这个框,实际上在原始图像对其5*5的矩阵进行了处理,而最后在conv2上只表现为一个神经单元5,所以5对应的感受野为5*5
实际上,我们通过计算conv2在conv1上的感受野,再计算其感受野再原始图像上的感受野,即可得到conv2在原始图像的感受野。其中自然有规律。
现在我们简单的用这个例子推到下:代表在那一层的filter的尺寸大小,代表步长,代表感受野大小,
通过我们可以得到conv2在conv1上的感受野为2,那么现在就相当于求在conv1上一个2*2的矩阵对应的原始图像的面积,实际上,每个conv1对应一个3*3面积,那么一个conv1上2*2矩阵对应的感受野是
其实自己推导一遍的话会有体会,现在直接给出公式:
参考:
[1] 深度神经网络中的感受野(Receptive Field)
网友评论