重读R-CNN

作者: 飞翔的小瓜瓜 | 来源:发表于2017-12-15 15:09 被阅读0次

一、非极大值抑制(NMS):

先计算出每一个bounding box的面积,然后根据score进行排序,把score最大的bounding box作为选定的框,计算其余bounding box与当前最大score与box的IoU,去除IoU大于设定的阈值的bounding box。然后重复上面的过程,直至候选bounding box为空,然后再将score小于一定阈值的选定框删除得到一类的结果

二、bounding-box regression

在pool5之后,利用pool5得到的feature进行一下回归!论文中写道,主要的错误出现在poor location,所以文章添加了一个bounding-box回归,这大大改善了location。

1.      为什么要做Bounding-box regression?

图10  示例

如图10所示,绿色的框为飞机的Ground Truth,红色的框是提取的Region Proposal。那么即便红色的框被分类器识别为飞机,但是由于红色的框定位不准(IoU<0.5),那么这张图相当于没有正确的检测出飞机。如果我们能对红色的框进行微调,使得经过微调后的窗口跟Ground Truth更接近,这样岂不是定位会更准确。确实,Bounding-box regression 就是用来微调这个窗口的。

2.      回归/微调的对象是什么?

3.      Bounding-box regression(边框回归)

那么经过何种变换才能从图11中的窗口P变为窗口呢?比较简单的思路就是:

注意:只有当Proposal和Ground Truth比较接近时(线性问题),我们才能将其作为训练样本训练我们的线性回归模型,否则会导致训练的回归模型不work(当Proposal跟GT离得较远,就是复杂的非线性问题了,此时用线性回归建模显然不合理)。这个也是G-CNN: an Iterative Grid Based Object Detector多次迭代实现目标准确定位的关键。

相关文章

  • R-CNN 物体检测第一弹

    R-CNN 物体检测第一弹 ​ 今天,重读了 R-CNN 的 TPAMI 版本,感觉受益颇多。该版相比之前的会...

  • 重读R-CNN

    一、非极大值抑制(NMS): 先计算出每一个bounding box的面积,然后根据score进行排序,把scor...

  • 检测网络

    实例分割模型 Mask R-CNN 详解:从 R-CNN,Fast R-CNN,Faster R-CNN 再到 M...

  • Mask R-CNN读书笔记

    3、Mask R-CNN(1)Mask R-CNN:  Mask R-CNN采取和Faster R-CNN一样的两...

  • Object Detection(四)Mask R-CNN

    之前介绍了 R-CNN Fast R-CNN Faster R-CNN,这是本系列的第四篇Mask R-CNN M...

  • 3 计算机视觉-阅读笔记(2)

    3.2.2 Fast R-CNN Fast R-CNN是在R-CNN的基础上发展而来的,总结R-CNN的缺点: 训...

  • Object Detection 3

    R-CNN三兄弟对比 转载自:xiaoiker FASTER R-CNN 相比FAST R-CNN,Faster ...

  • YOLO 系列 object detection 算法

    R-CNN 以及后续改进的 Fast R-CNN, Faster R-CNN 都是 region-based,也就...

  • Fast RCNN

    Fast R-CNN SPP Net真是个好方法,R-CNN的进阶版Fast R-CNN就是在R-CNN的基础上采...

  • 2018-12-22目标检测论文

    一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD https://a...

网友评论

    本文标题:重读R-CNN

    本文链接:https://www.haomeiwen.com/subject/efjwbxtx.html