1x1卷积层的作用

作者: 求索_700e | 来源:发表于2019-05-05 23:03 被阅读0次

ResNet 论文中的一个关于 1x1 conv 的细节
为什么要使用1x1卷积
PyTorch Convolution Layers
7.cnn
关于不同卷积核大小的思考
1x1卷积层的作用
神经网络实践经验（2）
1*1卷积核的作用
卷积神经网络的组件
1x1卷积

转自：https://www.jianshu.com/p/73faedf0887c

在各种神经网络都会用到1x1 conv，它到底起到什么作用呢？要回答这个问题，先从最经典的Inception模型说起，Figure 1是Inception-ResNet-v2的block架构图。

Figure 1: https://arxiv.org/pdf/1602.07261.pdf

作用一：改变矩阵维度

block中每个sublayer的第一层都1x1 conv，它在这里的作用之一是降维，减少运算量--feature map channel数越少，卷积操作需要的计算量越小。但就像图像压缩一样，压缩率越大丢帧越多，1x1 conv是如果做到在质量与速度的平衡的呢？

Figure 2

Figure 2中间图形就是1x1卷积核，左边的矩阵是input，而右边的正方形代表feature map中的一个grid，或一个pixel，它是1x1卷积核其中一个channel：(1x1x1)，与input矩阵对应pixel位置的pixel-wise向量：(1x1x32)的点积的结果。当input矩阵与1x1卷积核完成所有pixel位置（4x4）的点积计算后，会得到一个4x4x1 shape的feature map，grid size不变，整个过程相当于把一个3D矩阵压缩为一个2D矩阵。feature map经过非线性（激活函数）计算后，每个pixel位置就相当于input矩阵对应pixel位置的pixel-wise向量的均值。这就是为什么神经网络会用1x1 conv来改变矩阵维度的原因，无论是降维还是升维，矩阵的性质不变，所以可以构造出各种结构的神经网络

要特别注意的是，这里的一个Conv层并不是只有一个conv()，而是conv()、droupout()、BN()和ReLu()等组合。Conv层是CNN的底层模块，每个神经网络都有自己的定义，例如：

defConv(nin, nf, stride=1): return nn.Sequential(

nn.Conv2d(nin, nf, 3, stride, 1, bias=False),

nn.BatchNorm2d(nf),

nn.ReLU(inplace=True)

)

作用二：增加非线性

Figure 3: https://arxiv.org/pdf/1512.03385.pdf

Figure 3是Resnet-18/34/50/101/152的block架构图，图中黄色框位置是Resnet-50的一个block，它由三个Conv层组成，开头和结尾都是1x1 conv，三个block组成一个conv2_x层。把这三个block展开你会发现一个很有趣的结构，即block中的第二层、第三层，以及下一个block的第一层组成了一个如Figure 4，称为“bottleneck”的从低纬到高维又到低维的网络，bottleneck是瓶颈的意思，它是从一个空间到另一个大（或小）空间的过度地带，“小->大->小”或“大->小->大”都是bottleneck network。