paper: YOLOX: Exceeding YOLO Series in 2021
code: Megvii-BaseDetection/YOLOX
一、改进点
1.1 特征使用了Focus网络结构、CSPDarknet以及SPPNet
FocusCSPnet
CSPDarkNet使用CSPnet网络结构,CSPnet结构并不算复杂,就是将原来的残差块的堆叠进行了一个拆分,拆成左右两部分:主干部分继续进行原来的残差块的堆叠;另一部分则像一个残差边一样,经过少量处理直接连接到最后。因此可以认为CSP中存在一个大的残差边。
对于
SPP
模型结构如下:
class SPPBottleneck(nn.Module):
def __init__(self, in_channels, out_channels, kernel_sizes=(5, 9, 13), activation="silu"):
super().__init__()
hidden_channels = in_channels // 2
self.conv1 = BaseConv(in_channels, hidden_channels, 1, stride=1, act=activation)
self.m = nn.ModuleList([nn.MaxPool2d(kernel_size=ks, stride=1, padding=ks // 2) for ks in kernel_sizes])
conv2_channels = hidden_channels * (len(kernel_sizes) + 1)
self.conv2 = BaseConv(conv2_channels, out_channels, 1, stride=1, act=activation)
def forward(self, x):
x = self.conv1(x)
x = torch.cat([x] + [m(x) for m in self.m], dim=1)
x = self.conv2(x)
return x
1.2 分类回归层修改
分类回归层:Decoupled Head,以前版本的Yolo所用的解耦头是一起的,也就是分类和回归在一个1X1卷积里实现,YoloX认为这给网络的识别带来了不利影响。在YoloX中,Yolo Head被分为了两部分,分别实现,最后预测的时候才整合在一起。
1.3 Mosaic数据增强
1.4 Anchor Free:不使用先验框。
1.5 SimOTA :为不同大小的目标动态匹配正样本。
参考:
[1] 睿智的目标检测53——Pytorch搭建YoloX目标检测平台
[2] YoloX-Focus网络
网友评论