论文题名:《Res2Net: A New Multi-scale Backbone Architecture》
arxiv:https://arxiv.org/pdf/1904.01169.pdf
github: https://github.com/Res2Net/Res2Net-PretrainedModels
Res2Net是经典深度网络ResNet的一种变体。它主要是将多尺度作为提升网络性能的出发点,并结合分组卷积和类似特征金字塔FPN的思想所设计的一种backbone。
以往的多尺度都是基于不同层之间相加的方法,例如FPN,而本文是通过在同一层中结合来自不同小分块的不同感受野来得到多尺度的。本文思想比较简单明了,没有复杂的公式堆叠,相对原生的ResNet,性能有较大的提升。

这里的概念是通过增加块内的感受野,而不是一层一层地捕获图像中更细粒度的不同级别的尺度,从而提高CNN检测和管理图像中物体的能力。
作者将Res2Net块内的特征组数量称为“scale dimension”。因此上面的代码块是scale为4的Res2Net代码块。
正如图1所示,X2到X4是不断向下相加进行,越是后面的层所得到的感受就越大,而X1则充当的是恒等映射的角色,最后使用1x1卷积来融合通道信息。
在本文中,作者实验得到当scale=4,width=26时 可以得到速度和精度的均衡。
网友评论