深度学习知识点汇总-目标检测（1）

深度学习知识点汇总-目标检测（1）

作者: 深度学习模型优化 | 来源:发表于2019-05-22 04:21 被阅读0次

深度学习知识点汇总-目标检测（1）
深度学习知识点汇总-目标检测（5）
深度学习知识点汇总-目标检测（6）
深度学习知识点汇总-目标检测（7）
深度学习知识点汇总-目标检测（8）
深度学习知识点汇总-目标检测（9）
深度学习知识点汇总-目标检测（2）
深度学习知识点汇总-目标检测（3）
深度学习知识点汇总-目标检测（4）
深度学习——目标检测（1）

8.1 R-FCN

R-FCN属于two-stage的目标检测算法。

backbone部分RPN，这里使用ResNet。
head部分R-FCN，使用全连接网络。

其中ResNet-101 + R-FCN的方法在PASCAL VOC 2007测试数据集的mmAP达到83.6%。

图1 人脸检测

R-FCN的核心思想

得到目标多个特征。
假设我们只有一个特征图用来检测右眼。那么我们可以使用它定位人脸吗？应该可以。因为右眼应该在人脸图像的左上角，所以我们可以利用这一点定位整个人脸。如果我们还有其他用来检测左眼、鼻子或嘴巴的特征图，那么我们可以将检测结果结合起来，更好地定位人脸。
使用全卷积网络提高推理速度
在Faster R-CNN中，检测器使用了多个全连接层进行预测。如果有2000个ROI，那么成本非常高。R-FCN通过减少每个ROI所需的工作量实现加速。上面基于区域的特征图与ROI是独立的，可以在每个ROI之外单独计算。剩下的工作就比较简单了，因此R-FCN的速度比Faster R-CNN快。

图2 检测示意图

现在我们来看一下 $5\times5$ 的特征图M，内部包含一个灰色方块。我们将方块平均分成3×3个区域。在M中创建了一个新的特征图，来检测方块的左上角（TL）。这个新的特征图如图2（右）所示。只有绿色的网格单元[2,2]处于激活状态。

图3 生成9个得分图

我们将方块分成9个部分，由此创建了9个特征图，每个用来检测对应的目标区域。这些特征图叫做位置敏感得分图（position-sensitive score map），因为每个图检测目标的子区域（计算其得分）。

图4 vote_array

图4中红色虚线矩形是建议的ROI。我们将其分割成3×3个区域，并询问每个区域包含目标对应部分的概率是多少。例如，左上角ROI区域包含左眼的概率。我们将结果存储成3×3 vote数组，如图4（右）所示。例如，vote_array[0][0]包含左上角区域是否包含目标对应部分的得分。

图5 position-sensitive ROI-pool

将ROI应用到特征图上，输出一个3x3数组。将得分图和ROI映射到vote数组的过程叫做位置敏感ROI池化（position-sensitive ROI-pool）。

图6 ROI池化

将ROI的一部分叠加到对应的得分图上，计算V[i][j]。在计算出位置敏感ROI池化的所有值后，类别得分是其所有元素得分的平均值。

图7 R-FCN数据流图

假如我们有C个类别要检测。我们将其扩展为C+1个类别，这样就为背景（非目标）增加了一个新的类别。每个类别有3×3个得分图，因此一共有(C+1)×3×3个得分图。使用每个类别的得分图可以预测出该类别的类别得分。然后我们对这些得分应用 softmax 函数，计算出每个类别的概率。以下是数据流图，在本案例中，k=3。

相关文章

深度学习知识点汇总-目标检测（1）
8.1 R-FCN R-FCN属于two-stage的目标检测算法。 backbone部分RPN，这里使用ResN...
深度学习知识点汇总-目标检测（5）
8.5 YOLO V2 YOLO V2相比V1的改进部分有：大尺度预训练分类新网络：Darknet-19 加入...
深度学习知识点汇总-目标检测（6）
8.6 YOLO 9000 YOLO 9000可以检测9000个类别？这么牛逼。构造WordTree。 YOLO...
深度学习知识点汇总-目标检测（7）
8.7 YOLO v3 主要创新点：使用新的backbone网络：Darknet-53 在backbone和he...
深度学习知识点汇总-目标检测（8）
8.8 RetinaNet 本文参考了这篇文章。研究了one-stage和two-stage方法的优缺点。尤其...
深度学习知识点汇总-目标检测（9）
8.9 RFBNet 主要创新点：提出RFB模块。一句话就是在Inception的基础上加入了dilated卷积...
深度学习知识点汇总-目标检测（2）
8.2 SSD SSD的特点： Anchor框推荐，SSD称为先验框（Prior box）从不同的特征图中产生不...
深度学习知识点汇总-目标检测（3）
8.3 DSSD DSSD的核心思想： backbone使用ResNet替换了VGG，增强了特征提取能力。添加了...
深度学习知识点汇总-目标检测（4）
8.4 YOLO v1 YOLO v1的创新点：整张图作为一个输入，然后端到端的得到输出；速度快，是One-s...
深度学习——目标检测（1）
前言：深度学习在图像的应用中目标检测是最基本也是最常用的，下面介绍几种常见的目标检测算法或者模型什么是目标检测？...

网友评论

本文标题：深度学习知识点汇总-目标检测（1）

本文链接：https://www.haomeiwen.com/subject/tgilzqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|深度学习知识点汇总-目标检测（1）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！