YOLO(七) YOLOX

作者: blackmanba_084b | 来源:发表于2022-01-17 17:27 被阅读0次

YOLO(七) YOLOX
YOLOX:Exceeding YOLO Series in 2
YOLOX
目标检测YOLO系列——YOLO v3
[faster-rcnn][ssd][yolox][mobile
深度学习知识点汇总-目标检测（6）
yolo系列之yolo v3
使用DataPrefetcher加速PyTorch的datalo
YOLO 笔记
YOLOv2(一) 参考资料

paper： YOLOX: Exceeding YOLO Series in 2021
code: Megvii-BaseDetection/YOLOX

一、改进点

1.1 特征使用了Focus网络结构、CSPDarknet以及SPPNet

Focus

CSPnet

使用CSPnet网络结构，CSPnet结构并不算复杂，就是将原来的残差块的堆叠进行了一个拆分，拆成左右两部分：主干部分继续进行原来的残差块的堆叠；另一部分则像一个残差边一样，经过少量处理直接连接到最后。因此可以认为CSP中存在一个大的残差边。

CSPDarkNet
对于SPP模型结构如下：

class SPPBottleneck(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_sizes=(5, 9, 13), activation="silu"):
        super().__init__()
        hidden_channels = in_channels // 2
        self.conv1      = BaseConv(in_channels, hidden_channels, 1, stride=1, act=activation)
        self.m          = nn.ModuleList([nn.MaxPool2d(kernel_size=ks, stride=1, padding=ks // 2) for ks in kernel_sizes])
        conv2_channels  = hidden_channels * (len(kernel_sizes) + 1)
        self.conv2      = BaseConv(conv2_channels, out_channels, 1, stride=1, act=activation)

    def forward(self, x):
        x = self.conv1(x)
        x = torch.cat([x] + [m(x) for m in self.m], dim=1)
        x = self.conv2(x)
        return x