美文网首页
RetinaNet模型总结

RetinaNet模型总结

作者: csuhan | 来源:发表于2019-09-25 16:00 被阅读0次

    论文名称:Focal Loss for Dense Object Detection
    论文地址:传送门

    Introduction

    目前在目标检测领域,two-stage detector(如R-CNN系列)通常能取得较好的精度,但速度较慢;而one-stage detector(如SSD、YOLO)通常速度比较快,但精度会较低。如何保持检测速度的同时,能够提高one-stage检测精度,作者指出类别不平衡性是主要原因,因此作者提出了Focal Loss来解决类别不平衡问题,使本文提出的RetinaNet也能实现较高的精度。
    类别不平衡性通常会导致两个问题:

    1. 许多易分类的负样本对训练没有什么贡献,导致训练较为低效。
    2. 这些Negetive的样本影响模型的训练,导致模型整体学习方向偏离。

    而在two-stage detector中,通常有两种解决方案:

    1. 使用两个阶段进行递归(cascade)。在多阶段cascade时,可以逐渐筛去easy negetives,使得样本之间平衡。
    2. 选择mnibatch时,有针对的选择正负样本。如正:负=1:3。

    Focal Loss

    为了解决正负样本间的极度不平衡性,作者提出了Focal Loss。

    通常情况下,对于两分类问题我们使用Cross Entropy Loss,即:
    CE(p,y)=\begin{cases} -log(p), & \mbox{if } \quad y = 1 \\ -log(1-p), & otherwise. \end{cases}
    其中y为Ground truth label,p \in [0,1]为预测结果,为了方便描述,CE也可以表示为:
    p_t=\begin{cases} p & \mbox{if} \quad y=1\\ 1-p & otherwise \end{cases}
    此时有CE(p,y)=CE(p_t)=-log(p_t),对应下图曲线上的蓝色曲线。可以看到,即使p \ge 0.8,仍有很大的loss。
    这种损失的一个显着特征是,即使很容易分类(pt≫ .5)的例子,其损失也具有不小的幅度。 如果将大量简单的例子相加,这些小的损耗值可能会导致错误的类别。

    为了解决这个问题,作者提出了Balanced Cross Entropy,即:
    CE(p_t)=- \alpha_t log(p_t)

    为了降低易分类目标(easy examples)的权重,使模型在训练时更加专注于难分类样本(hard exmaples),作者提出了Focal Loss,不同\gamma对应的图像如上图所示。
    FL(p_t)=-(1-p_t)^{\gamma}log(p_t)

    使用Focal Loss之后,大量易分的negtives的loss就减小了,从而使模型更加专注于难以区分的目标。

    Focal Loss还有另一种形式:
    FL(p_t)=-\alpha_t(1-p_t)^{\gamma}log(p_t)
    本文实验采用的即时此种形式。

    RetinaNet Detector

    RetinaNet
    1. ReNet作为backbone
    2. 采用FPN(Feature Pyramid Network)进行不同scale的采样。
    3. 对于每个scale level,都有一个class net和box net。
    4. 将最终预测的anchor进行merge,使用NMS进行筛选。

    其中,FPN使用的的是P_3P_7P_3 \dots P_5 \rightarrow C_3 \dots C_5,而P_6是对C_5进行卷积得到的,P_7是通过对C_6卷积得到的。

    对于每个level,不仅仅是从32^2512^2的大小,还有\{2^0,2^{1/3},2^{2/3}\}三个尺寸,每个尺寸都有三个ratio:\{1:2,1:1,2:1\},即每个level都有9个anchor box。对于每个anchor box,都单独预测K个class,即总共需要KA个值。

    对于box net,则简单的预测4A个值,对应着A个anchor box的坐标。

    相关文章

      网友评论

          本文标题:RetinaNet模型总结

          本文链接:https://www.haomeiwen.com/subject/pftwuctx.html