全文精髓,见图1

总结起来就是
- 如果HxW 表示输出特征图的空间大小,N 代表输入通道数,KxK 代表卷积核的大小,M 代表输出通道数,那么,标准卷积的计算成本变成了 HWNK²M。
- 标准卷积的计算成本与以下因素成比例:(1)输出特征图的空间大小 HxW,(2)卷积核的大小 K²,(3)输入通道和输出通道的数量 NxM。
- 在空间上节约计算成本,就是减小卷积核大小K。如conv 1x1,这种卷积被用来「融合」各个通道的信息。
- 在通道上节约计算成本,就是减小输入输出通道数量。如分组卷积 gconv 是卷积的一种变体,其中输入特征图的通道被分组,然后卷积在每组通道上独立进行。
- Depthwise 卷积是分组卷积特例,卷积在每个输入通道上独立执行的,输入和输出的通道数相同。
- 通道混洗是改变 ShuffleNet中所用通道顺序的操作层,通常与分组卷积共同使用。
- ResNeX ---> ResNeXt,主要是用分组卷积gconv替换普通卷积conv。
- MobileNet (可分离卷积) ---> MobileNet-v2, 单个的 conv1x1 被分解成两个 conv1x1.(还有其他的改进吧)
网友评论