目标检测算法---faster rcnn 知识简要回顾（测试篇）

作者: 教训小磊 | 来源:发表于2022-05-08 18:20 被阅读0次

必须知道的
目标检测算法---faster rcnn 知识简要回顾（测试篇）
目标检测算法---faster rcnn 知识简要回顾（训练篇）
Faster-RCNN和SSD检测效果比较
Faster RCNN
目标检测｜实战总结
fast rcnn学习
RCNN，Fast RCNN and Faster RCNN
6. RCNN--Fast-RCNN--Faster-RCNN技
目标检测

最近对目标检测领域经典的faster rcnn算法做了一些回顾，在此记录一下。

faster rcnn算法流程

Faster RCNN检测部分主要可以分为四个模块：
1.特征抽取：用于抽取图像特征，一般可以使用vgg、resnet和mobilenet等backbone；
2.RPN（Region Proposal Network）：用于产生候选框，主要做一些粗糙的分类和回归操作；
3.RoI Pooling：主要是为了解决全连接层需要固定尺寸输入，而实际输入大小不一的问题；
4.Classification and Regression：精细化分类和回归。

faster rcnn算法大致流程如下：
彩色图像通过backbone进行特征提取，输出最后一层的feature map。接着将这些feature map进一步做基于3x3卷积核的特征提取，该目的是增强模型的鲁棒性。将输出送入两个分支，第一个分支跟类别有关，这里主要是用于简单分类，区分是背景还是物体，这是针对anchor而言的；第二个分支则是用于初步预测候选框的偏移量，这个也是基于anchor而言的；再将前两个分支的结果送入图中的proposal中，首先会根据positive类的score筛选前6000个候选框，再将anchor的坐标和得到的偏移进行整合，得到初步候选框坐标，接着在做NMS,除去重叠严重的框，再经过了NMS后的框中，根据类别score取前300个框。然后将结果送入roi pooing层，用于生成固定尺寸的特征区域，以方便后边的全连接层接受信息；全连接层用于最后提取特征，得到精细的类别和框的偏移量。