美文网首页深度学习-推荐系统-CV-NLP
【论文笔记】BlazeFace: Sub-millisecond

【论文笔记】BlazeFace: Sub-millisecond

作者: 昭君姐 | 来源:发表于2019-07-13 20:43 被阅读3次

    Paper Reading Note

    URL:
    论文pdf

    TL;DR

    Google出品。亚毫秒级的移动端人脸检测算法。移动端可达200~1000+FPS速度。主要以下改进:

    • 轻量级feature受启发于Mobile系列
    • 基于SSD的对移动端GPU更友好的anchor策略
    • 改进的联合分辨率(tie resolution)策略来替代NMS方法

    Information below is optional; you can change/remove it if you like

    方法

    Enlarging the receptive field sizes

    在深度可分离卷积中,计算量主要为point-wise部分,增加depth-wise部分卷积核大小并不会明显增加成本。因此本文在depth-wise部分采用了5x5的卷积核,已获得更大的感受野,故此可以降低在层数上的需求。
    此外,启发于mobilenetV2,本文设计了一个先升后降的double BlazeBlock。BlazeBlock适用于浅层,double BlazeBlock适用于深层。


    BlazeBlock (left) and double BlazeBlock

    Feature extractor

    • 5个BlazeBlock和6个double BlazeBlock
    • 输入是3x128x128,channel最大为96,feature map大小最小为8x8

    Anchor scheme

    16x16的anchor是一样的,但本文将8x8,4x4和2x2的2个anchor替换到8x8的6个anchor。此外强制限制人脸的长宽为1:1。


    Anchor computation: SSD (left) vs. BlazeFace

    Post-processing

    由于最后一层feature map较大(相对于ssd),导致预测结果会较多,在连续帧预测过程中,nms会变导致人脸框变得更加抖动。本文在原始边界框的回归参数估计变为其与重叠概率的加权平均。这基本没有带来预测时间上的消耗,但在提升了10%的性能。

    实验

    效果好速度快的方法想不想要?


    跟mobilenetv2+ssd的效果对比
    各终端上的速度比较

    相关文章

      网友评论

        本文标题:【论文笔记】BlazeFace: Sub-millisecond

        本文链接:https://www.haomeiwen.com/subject/funmkctx.html