美文网首页
(17)IOUNet

(17)IOUNet

作者: 顽皮的石头7788121 | 来源:发表于2019-03-13 13:56 被阅读0次

IOU_Net是对目前目标检测中IOU区域选择不合理而提出的网络。主要改进在两个方面。

#(1)IoU-guided-NMS

        当前目标检测算法主要有以下几个步骤:通过RPN网络生成proposal,在proposal上进行池化,使得特征图大小一致,并提取特征进行分类;区域的筛选和回归这几部分。

        其中。区域筛选是一个重要部分,如何从众多的候选框中选择出最匹配的框。在目标检测中通常都是采用非极大值抑制的方法(NMS)来实现的。通过类别得分较高的bbox来抑制类别得分较低的bbox。

        但是这种方法存在一些问题,一方面会使得分高但是位置不够准的框可能会把分低但是位置很准的框杀掉;另一方面,使用分类的得分作为定位框的得分本来就缺乏可解释性,使得定位准确性降低。

        因此IOUNet就是利用IOU得分作为定位的得分,以提高定位精度。

        针对NMS的问题,很多文章对此进行了讨论。延伸出了很多变种。

        分别是:NMS、soft-NMS、locality_aware_NMS、IoU-guided-NMS。

        其中:

                    NMS:最早的NMS,根据边界框的分类置信度排序,每次选择cls score最大的框,并对与它IoU大于阈值的框抑制,直接将其置信度置为0。定位准确的边界框中有很大一部分会被错误抑制,这是由分类置信度和定位准确度之间的不匹配造成的。

                    soft-NMS:NMS基础上,IoU 大于阈值的框不将其分类置信度置为0,而是将其置信度使用线性加权或者高斯加权降低。与最高得分的IOU的交集越大,分数降低的越多。

                     locality_aware_NMS:将2个IOU高于某个threshold的输出框,进行基于得分的合并。合并后的输出框的坐标数值介于2个合并的输入框之间,这样操作可以将所有回归出的框的坐标信息都利用起来,有助于减少位置误差,而不是像传统的nms一样,直接取分数最高的那个。

                      IoU-guided-NMS:使用预测得到的IoU来对预测框进行排序,每次选择IoU最大的框并对与它IoU大于一定阈值的框抑制。使用预测的IOU得分替换原始的分类得分,然后对分类得分和IOU得分进行跟新。

#(2)Precise Roi Pooling

            引入了PrRoI 池化来完成的边界框修正。采用积分方式计算每个bin的值。以往使用的是ROI pooling ,mask 中改进成了POI Align。他们的区别如下:

different ROI

ROI Pooling :通过池化,使特征图固定到特定大小,满足卷积神经网络的需求。而池化过程可能并不能整除如25*25池化到7*7大小,一般情况下会向下取整,这样就会导致不准确。

ROI Align :首先,将浮点值的ROI划分成k*k个bin,对于1个bin计算该bin的值时也不对该bin的坐标进行量化,而是在该bin中均匀取4个点,这4个点的坐标用(ai, bi)表示,通过计算f(ai,bi)得到该点的特征值,计算公式使用双线性插值。

PrROI Pooling :采用积分方式计算每个bin的值。这种计算方式和ROI Align最大的区别在于计算一个bin的值时不仅仅考虑该bin中4个插值点的均值,而是将bin中的插值看作是连续的。

相关文章

网友评论

      本文标题:(17)IOUNet

      本文链接:https://www.haomeiwen.com/subject/xndvpqtx.html