SPP Net

作者: 数据智能谷 | 来源:发表于2019-10-20 07:37 被阅读0次

SPP Net

SPP:Spatial Pyramid Pooling(空间金字塔池化)

SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。

众所周知,CNN一般都含有卷积部分和全连接部分,其中,卷积层不需要固定尺寸的图像,而全连接层是需要固定大小的输入。
所以当全连接层面对各种尺寸的输入数据时,就需要对输入数据进行crop(crop就是从一个大图扣出网络输入大小的patch,比如227×227),或warp(把一个边界框bounding box的内容resize成227×227)等一系列操作以统一图片的尺寸大小,比如224224(ImageNet)、3232(LenNet)、96*96等。

所以才如你在上文中看到的,在R-CNN中,“因为取出的区域大小各自不同,所以需要将每个Region Proposal缩放(warp)成统一的227x227的大小并输入到CNN”。

但warp/crop这种预处理,导致的问题要么被拉伸变形、要么物体不全,限制了识别精确度
SPP Net的作者Kaiming He等人逆向思考,既然由于全连接FC层的存在,普通的CNN需要通过固定输入图片的大小来使得全连接层的输入固定。那借鉴卷积层可以适应任何尺寸,为何不能在卷积层的最后加入某种结构,使得后面全连接层得到的输入变成固定的呢?

这个“化腐朽为神奇”的结构就是spatial pyramid pooling layer。

下图便是R-CNN和SPP Net检测流程的比较:

它的特点有两个:

1.结合空间金字塔方法实现CNNs的多尺度输入。

SPP Net的第一个贡献就是在最后一个卷积层后,接入了金字塔池化层,保证传到下一层全连接层的输入固定。

换句话说,在普通的CNN机构中,输入图像的尺寸往往是固定的(比如224*224像素),输出则是一个固定维数的向量。SPP Net在普通的CNN结构中加入了ROI池化层(ROI Pooling),使得网络的输入图像可以是任意尺寸的,输出则不变,同样是一个固定维数的向量。

简言之,CNN原本只能固定输入、固定输出,CNN加上SPP之后,便能任意输入、固定输出。

ROI池化层一般跟在卷积层后面,此时网络的输入可以是任意尺度的,在SPP layer中每一个pooling的filter会根据输入调整大小,而SPP的输出则是固定维数的向量,然后给到全连接FC层。


image.png

只对原图提取一次卷积特征

在R-CNN中,每个候选框先resize到统一大小,然后分别作为CNN的输入,这样是很低效的。

而SPP Net根据这个缺点做了优化:只对原图进行一次卷积计算,便得到整张图的卷积特征feature map,然后找到每个候选框在feature map上的映射patch,将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层,完成特征提取工作。

如此这般,R-CNN要对每个区域计算卷积,而SPPNet只需要计算一次卷积,从而节省了大量的计算时间,比R-CNN有一百倍左右的提速。

image.png

相关文章

  • SPP Net

    SPP Net SPP:Spatial Pyramid Pooling(空间金字塔池化) SPP-Net是出自20...

  • SPP Net

    SPPnet R-CNNvsSPP net: SPP net的优势: 1.SPP可以生成固定大小的向量,以此适应f...

  • SPP-Net

    SPPNet Abstract Key insight 传统的CNN要求输入图像尺寸是固定的,所以通常要改变图片的...

  • 检测之旧文新读(三)-Fast R-CNN

    动机: 可以说这一篇论文,是进一步的优化SPP-Net在检测上面的工作。那么作者肯定是看到SPP-net针对检测的...

  • 读论文系列:Object Detection SPP-net

    本文为您解读ECCV2014 SPP-net: Spatial Pyramid Pooling in Deep C...

  • 语义分割(2)SPP net

    Spatial Pyramid Pooling in Deep Convolutional Networks fo...

  • 4. SPP-Net

    基于深度学习的目标检测技术演进:R-CNN -> SPP-Net -> Fast-RCNN -> Faster-R...

  • 5. Fast R-CNN

    基于深度学习的目标检测技术演进:R-CNN -> SPP-Net -> Fast-RCNN -> Faster-R...

  • SPP-net文章详细解读

    文章《Spatial Pyramid Pooling in Deep Convolutional Networks...

  • 2016-04-14 今日收集

    【目标识别】深度学习进行目标识别的资源列表:O网页链接包括RNN、MultiBox、SPP-Net、DeepID-...

网友评论

      本文标题:SPP Net

      本文链接:https://www.haomeiwen.com/subject/uaghectx.html