SABL:侧面边框定位的目标检测

作者: 寒夏凉秋 | 来源:发表于2020-03-12 11:56 被阅读0次

SABL:侧面边框定位的目标检测
目标检测概念
综述
IOU-Based Loss in Object Detecti
目标检测
3、目标检测之检测算法
深度学习第9次作业机器学习目标检测
卷积神经网络-目标检测
【目标检测】什么是边框回归
这个Python库真的太好用了，10行代码就能轻松搞定目标检测

SABL:侧面边框定位的目标检测

论文题目:Side-Aware Boundary Localization for More Precise Object Detection

亮点:

通过特征图内容的边界信息来进行定位bbox的边框,取代了之前通过中心点加anchor滑窗的方式,得到更高质量的bbox边界信息.
通过rescore的方式,提高高质量边框的分类分数

image

解决的问题:
主流的边框生成方法都是通过预测中心点以及中心偏移的offset来得到
边框或者proposal信息.
然而这样并不能很好地提高定位精度.

而在本文中,目标框的生成直接从特征图的边框开始关注;

简单来说,本文的步骤

将目标空间分为多个桶区域(buckets)
先确定其边框在哪个buckets上
然后再回归其边框线离bucket中心点的offset.这样通过四个边框的精准回归来得到高质量边框坐标信息.

其主要流程如图所示:

image

通过三个模块来实现该idea:

Side-Aware Feature Extraction
Boundary Localization with Bucketing
Feature-Aligned Refinement

Side-Aware Feature Extraction

该模块主要用于将RPN抽取的特征图(roi features),沿着X、Y轴方向进行分解,然后再进过upsample后分离出四个方向( $\mathcal{F}_{left}$ 、 $\mathcal{F}_{right}$ 、 $\mathcal{F}_{top}$ 、 $\mathcal{F}_{bottom}$ )的特征图;

其示意图如下所示:

image

(论文中用k=7做说明)

(1) 首先, rpn网络送进来的proposal首先经过ROIAlign得到 ROI特征图.

(2) 该ROI特征图首先经过两个3*3的卷积,得到特征输出 $\mathcal{F}_{7 *7*c}$

(3) 为了更好地获取roi区域的特定方向信息,作者采用了self-attention机制来增强roi,具体操作是:

将特征图经由两个1*1的卷积进行self-attention信息抽取,得到通道信息融合后的两个7*7的attention-map( $\mathcal{M}_{x}$ , $\mathcal{M}_{y}$ )

然后将原来的 $\mathcal{F}_{7 *7*c}$ 与两个方向上的attention-map进行aggregate操作,得到X,Y轴上的特征图;

$\begin{aligned} &\mathcal{F}_{x}=\sum_{y} \mathcal{F}(y,:) * \mathcal{M}_{x}(y,:)\\ &\mathcal{F}_{y}=\sum_{x} \mathcal{F}(:, x) * \mathcal{M}_{y}(:, x) \end{aligned}$

(4) $\mathcal{F}_{x}$ 和 $\mathcal{F}_{y}$ 都是一维向量(1*k) or (k * 1) ,然后经过1*3的卷积或者3*1的卷积,再经过upsample * 2 后,得到 1*2k,或者2k*1,这样就能各自分离出4个方向的feature( $\mathcal{F}_{left}$ 、 $\mathcal{F}_{right}$ 、 $\mathcal{F}_{top}$ 、 $\mathcal{F}_{bottom}$ )

其亮点:

self-attention的引用
分离后继续upsample操作;

Boundary Localization with Bucketing

给定一个proposal box( $B_{left},B_{right},B_{top},B_{right}$ ),将边框放大 $\sigma$ 倍,以便能覆盖整个物体;

候选区域(特征图)上划分2*k个buckets区域,每个边界中心线与一个bucket对应.每个bucket的宽度为:
$l_{x}=\left(\sigma B_{\text {right}}-\sigma B_{\text {left}}\right) / 2 k$
$l_{y}=\left(\sigma B_{\text {down}}-\sigma B_{\text {top}}\right) / 2 k$

采取二分类的形式,来觉得bbox的边框与哪个bucket最接近.(训练时候把每边中心线最接近gt的bucket作为正样本(1),其他标记为0 负样本来训练)

image

这样得到边框的粗略估计(coarse estimation),图中橙色虚线框所组成的边框;
还需要对边框进行更精准的回归定位;

localization targets

image

为了提高精细回归分支的稳健性，作者同时包含了最近的（在粗略估计步骤中标记为“正”）存储桶和第二个最近的（在粗略估计步骤中标记为“忽略”）存储桶来训练回归器。回归目标是铲斗中心线和相应的地面真相边界之间的位移。

(就是top2 bucket在粗略估计分支中作为负样本,top1 bucket 仅提供一个更精准的proposal来使用.但是在精准回归分支的时候,同时选用top1 top2的两个offset,以更精准地定位)

Bucketing-guided rescoring

前面都通过bucket机制得到更精准的bbox location了,当然不能因为这些边框的score太低而被nms掉了.

所以一个简单地想法就是要提高这些高质量框的分数.(分类分数会乘上一个边框系数,得到最终的分数作为nms)

Feature-Align Refinement

简单来说,就是一个特征重用的模块,其目的在于减少计算量;

image

对于Side-Aware Feature Extraction 模块抽取的特征.通过线性插值的方式得到位置对齐特征.然后进行位置回归.

one-stage detector的应用:

SABL作为一个边框回归定位模块,也适用于one-stage的检测器;

如图所示:

image

将抽取的特征作为两部分:

box subnet 采取SABL的方式抽取bbox边框信息;
class subnet 获取label信息;

实验对比

image

作为一个更精准的边框回归模块,SABL实验效果还是很漂亮的;

速度提升了,效果还涨了1-2个map点;

代码部分

(作者说开源在mmdetection上,至今2020/3/12 还在🕊)

总结

其亮点在于

先关注边框边界的方式来精准回归 bbox 的location,算是另一种anchor-free的方式把(如果不用rpn的话).比中心点+anchor的方式能更好地定位精准边框

与其他对比:

fcos通过特征图逐像素点回归四个边界的offset方式来得到bbox location,然后通过 center-ness来抑制低质量框
(two-stage系列) rpn 网络通过中心点滑窗+anchor的方式生成proposal 再通过多阶段地边框回归来得到更精准的bbox location
reppoint 通过dcn卷积的方式,得到k个点代表了其object的边缘信息,再转化成bbox 矩形框的方式得到bbox location

reference

Wang J, Zhang W, Cao Y, et al. Side-Aware Boundary Localization for More Precise Object Detection[J]. arXiv preprint arXiv:1912.04260, 2019.

SABL:侧面边框定位的目标检测
SABL:侧面边框定位的目标检测论文题目:Side-Aware Boundary Localization fo...
目标检测概念
一、目标检测概念目标检测的实质是多目标的定位，即要在图片中定位多个目标物体。例如下图，既要定位各个目标，还需要...
综述
目标分类、定位、检测分类：是什么？定位：在哪里？是什么？（单个目标）检测：在哪里？分别是什么？（多个目标） ...
IOU-Based Loss in Object Detecti
目标检测的定位回归损失为Smooth L1损失但是这种loss假设4个点独立，但是实际上边框的4个点之间是有联系的...
目标检测
目标定位目标检测是计算机视觉中一个热门的应用领域，实现目标检测首先需要实现目标的定位问题。通常一张图片有多个目标...
3、目标检测之检测算法
目标检测（Object detection）目标检测-分类器学过了对象定位和特征点检测，今天我们来构建一个对象...
深度学习第9次作业机器学习目标检测
目标定位目标检测的任务是在图片中定位物体，并将位置标注出来标记四类存在与否，定位需要定位目标中心坐标(b_x, ...
卷积神经网络-目标检测
1. 目标定位和特征点检测图片检测问题：分类问题：判断图中是否为汽车；目标定位：判断是否为汽车，并确定具体位...
【目标检测】什么是边框回归
1、什么是边框回归目标检测过程中对产生的候选框以标注好的真实框为目标进行逼近的过程。由于一幅图像上的框可以由中心...
这个Python库真的太好用了，10行代码就能轻松搞定目标检测
目标检测是指计算机和软件系统对图像或场景中的目标进行定位和识别的任务。目标检测已广泛应用于人脸检测、车辆检测、人...