美文网首页
人脸检测-PyramidBbox 读后感

人脸检测-PyramidBbox 读后感

作者: 教训小磊 | 来源:发表于2019-09-28 16:42 被阅读0次

这篇由百度提出的pyramidbox前前后后看了快一个星期,中途好多东西都看不懂,然后就转去看了S3FD和SSH。Pyramidbox结合了很多前人的技术和思想,比如FPN、Max-out等。当然本文作者也提出了一些新的思想,如pyramidanchor、data-anchor-sampling等。

本文最大的特色是加入了上下文信息在检测过程中(其实在SSH中就有用到上下文信息,但那时没有重点用),头部信息和身体信息的加入更加有利于检测人脸,所以在训练的时候还要加入头部和身体标签,这个工作量有点大。接下去由我来稍稍梳理一下这篇文章的思路。

图一 pyramidbox 整体框架图

正如上图一 所示,Pyramidbox的主架构采用的是S3FD的架构,骨干网络是VGG16,取Pooling5及以前的层,将FC6,FC7下采样为conv_fc6和

conv_fc7,然后再加了几层卷积层来增加深度,从而使模型获得更好的非线性拟合。因为平衡每一种尺度的人脸对检测小脸很重要,所以这整一部分中卷积的步长是anchor尺寸的四分之一,这样可以使各种尺度的人脸匹配到差不多数量的anchor,更加详细的内容可以查阅S3FD这篇文章。https://arxiv.org/abs/1708.05237

第二部分是LFPN,如下图二,这是对何凯明的FPN(图三)的改进,本文给出了改进的理由:并不是所有的高维特征都有助于小脸的检测,同时在小脸中抽取高维特征容易引入噪声并且较小的、模糊的、被遮挡的人脸与较大的、清晰的、完整的的人脸有不同的纹理特征等所以本文作者并不是像原生FPN那样直接从top层向下融合,而是从中间conv_fc7开始,这一层的感受野是原图尺寸的一半,不容易引入噪声。如果细看LFPN和FPN除了开始层数不一样外,用1x1卷积来升维的地方也不一样。可惜作者并没有说明原因。

图二 LFPN结构图 图三 FPN结构图

第三部分是CPM,这部分的思想是受到了Inception-Resnet的又宽又深的启发,因此结合了SSH和DSSD中优秀的思想改进,具体就是将SSH的检测模块包括上下文模块里面的3x3卷积全部换成了DSSD中的残差预测快,这样既有了宽度又有了深度。它的输出通道统一是20个:4个脸部类别,2个头部类别,2个身体类别,以及脸部、头部、身体的回归框位置分别4个。如下图四所示

图四 CPM结构

第四部分是Pyramidanchor,这部分我读了好几遍,但是依然有很多不清楚的,接下去就说我的理解吧,如有不对的请大家指正哈。Pyramidanchor和下面的Max-in-out都在CPM里面的,这一部分的主角是脸部、头部和身体,但是在融合的过程中,这三部分的信息均来自不同层,这个我比较不明白,为什么不是来自同一层呢,还有从图中可以看出最后几个层都没有凑齐3个信息。(这一部分我是看的一脸懵逼)。具体可以看一下图五这个例子。

图五 PramidAnchor 检测例子 图六 例子解释

最后我再讲讲data-anchor-sampling和Max-in-out。前者是一种数据增强的方式,单看里面的公式不太好懂,但是本文作者给大家举了一个例子,基本明了。Max-in-out是对Max-out的一种改进,后者只是针对negative样本做处理,而前者对positive样本也做了处理,本文作者在conv3_3这一层用正:负=1:3,因为这一层小anchor较多,正负样本比不平衡,后面的层则全部是正:负=3:1。如下图七所示。

图七 Max-in-out 结构

相关文章

  • 人脸检测-PyramidBbox 读后感

    这篇由百度提出的pyramidbox前前后后看了快一个星期,中途好多东西都看不懂,然后就转去看了S3FD和SSH。...

  • MTCNN

      人脸任务总体上分为:人脸检测、人脸关键点检测、人脸判别、人脸识别、人脸聚类等。  作者认为人脸检测和人脸关键点...

  • opencv之人脸检测项目实战(二)

    自我介绍 目录 一、人脸检测整体架构1.1 什么是人脸检测?1.2 人脸检测的应用场景1.3 人脸检测核心架构二、...

  • 安卓OpenCV开发(二)人脸检测

    重点是人脸检测,检测,检测。 就是把人脸检测出来,不是识别,不是识别,不是识别。识别的意思,就是检测到人脸,并且通...

  • 人脸活体检测

    人脸检测 关键点检测 人脸对齐(仿射变换) 活体检测/身份识别

  • 人脸识别

    图片人脸检测——OpenCV版(二) 图片人脸检测——Dlib版(四) 人脸识别之人脸对齐(一)--定义及作用

  • iOS ---人脸检测

    检测图像中的人脸 Core Image可以分析并找到图像中的人脸。它执行的是人脸检测,而不是识别。人脸检测是识别包...

  • Android之基于Facenet模型比对视频中的人脸

    前言 继续前面 MTCNN移植安卓并检测视频中人脸 ,已经检测到人脸,那么需要对所检测的人脸和本地的人脸数据做比对...

  • 较为成熟的安卓项目--人面识别,手势识别向

    一、 人脸识别 1. 目标检测&目标追踪&人脸检测&人脸识别 GitHub:https://github.com/...

  • AVFoundation开发秘籍笔记-07高级捕捉功能之人脸识别

    一、概述 这里的人脸检测是通过AVFoundation实现的实时人脸检测功能,会在检测到人脸自动建立相应的焦点。 ...

网友评论

      本文标题:人脸检测-PyramidBbox 读后感

      本文链接:https://www.haomeiwen.com/subject/lwqyyctx.html