2020-07-07 Deep Snake for Real-T

作者: Joyner2018 | 来源:发表于2020-07-08 00:07 被阅读0次

2020-07-07 Deep Snake for Real-T
R01:一元线性回归
如何使用C#的对象构造器
讲解：Snake Battle、c++、C/C++C/C++|D
2018-04-27
网络图片链接
贪吃蛇 The Snake Game -- 使用Javascri
Modern Snake
Farmer and Snake
A Fake Snake

Paper reading

1.Title

Deep Snake for Real-Time Instance Segmentation

2.Author

Sida Peng, Wen Jiang, Huaijin Pi, Xiuli Li, Hujun Bao, Xiaowei Zhou

3.单位

浙江大学CAD
CG国家重点实验室
浙大三维视觉实验室

4.论文地址

https://arxiv.org/abs/2001.01629
https://github.com/zju3dv/snake/

5.数据集

Cityscapes
KINS
SBD
COCO

6.摘要

当前的方法在实例分割上的局限性

当前做instance segmentation的大多数工作采用了Mask R-CNN 的Pipeline。

它基本的pipeline是先检测物体矩形框，然后在矩形框中做逐像素分割。
Mask R-CNN达到了很好的instance segmentation的结果，但是这样的pipeline其实有一些limitation：

在矩形框中做逐像素分割会受限于矩形框的准确度。如果矩形框本来就不准，比如没有完全覆盖物体，那就算框中的分割做的再好，也无法得到正确的instance mask。

逐像素分割计算量其实很大，后续处理计算量也大。因为逐像素分割计算量大，所以网络一般将矩形框区域downsample为28x28的网格，然后进行分割，之后再把分割结果upsample到原图大小。这个upsample根据Mask R-CNN论文里的统计是有15ms的，比较费时。还有个问题是，在28x28网格上做分割会损失精度。即使28x28的网格上的分割结果完全正确，upsample到原图的mask仍然是很粗糙的。

逐像素分割不适用于一些物体，比如细胞和文本。

选择Contour作为Shape representation

考虑到逐像素分割有诸多限制，文章的工作选择用contour来表示物体的shape。Contour是一组有序的点，而且是首尾相连的。比如图片中猫的边缘就是一个Contour。

Contour相对于用稠密像素表示物体有两大优势：

参数量远小于稠密像素，更接近于box的参数量。这样使得instance segmentation的速度上限更高，也能更廉价地使用分割结果。这里举个例子就是tracking。现在tracking主要还是使用box做跟踪，用物体的dense pixels做tracking计算量会很大。如果把dense pixel换成用contour做tracking就会好很多。

Contour更适用于细胞、文字这些物体的分割。

7.贡献

提出基于学习的snake算法用于实时实例分割，对初始轮廓调整至目标边界，并且引入循环卷积(circular convolution)进行轮廓特征的学习。
提出two-stage流程进行实例分割，先初始化轮廓再调整轮廓，两个步骤均可以用于修正初始定位的误差。
Deep snake能在多个实例分割数据集上达到SOTA，对于512的图片输入能达到32.3fps。

8.提出方法和框架

实例分割是许多计算机视觉任务中的重要手段，目前大多数的算法都采用在给定的bbox中进行pixel-wise分割的方法。受snake算法和Curve-GCN的启发，论文采用基于轮廓的逐步调整策略，提出了Deep snake算法进行实时实例分割，该算法将初始轮廓逐渐优化为目标的边界，如图所示，达到很好的性能且依然保持很高的实时性(32.3fps)。
Deep snake方法将初始轮廓逐渐优化为目标的边界来进行目标分割，即将物体轮廓作为输入，基于CNN主干特征预测每个顶点的偏移量。为了充分利用轮廓拓扑结构，论文使用循环卷积(circular convolution)进行顶点特征的学习，有助于学习轮廓的优化，并基于deep snake提出了一套实时实例分割的流程。

Learning-based snake algorithm

传统的snake算法将顶点的坐标作为变量来优化人工设计的能量函数(energy function)，通过最小化能量函数来拟合目标边界。由于能量函数通常是非凸的，而且需要基于低维图像特征进行人工设计，通常会陷于局部最优解。
而deep snake则是直接从数据学习如何微调轮廓，对于个顶点，首先构造每个顶点的特征向量，顶点的特征为对应的网络特征和顶点坐标的concate，其中为主干网络输出的特征图，为顶点处的双线性差值输出，附加的用于描述顶点间的位置关系，是平移不变的，由每个顶点坐标减去轮廓中所有顶点的最小和得到相对坐标。

在获得顶点特征后，需要对轮廓特征进一步学习，顶点的特征可以视作1-D离散信号，然后使用标准卷积对顶点逐个进行处理，但这样会破坏轮廓的拓扑结构。因此，将顶点特征定义为公式1的周期信号，然后使用公式2的循环卷积进行特征学习，为可学习的卷积核，为标准卷积操作。

循环卷积操作如图所示，与标准的卷积操作类似，可以很简单地集成到目前的网络中。在特征学习后，对每个顶点使用3个卷积层进行偏移的输出，实验中循环卷积的核大小固定为9。

图a展示了deep snake的细节结构，输入为初始轮廓，主干包含8个"CirConv-Bn-ReLU"层，每层都使用残差连接，Fusion block用于融合主干网络中的多尺度轮廓特征，Prediction head使用3个卷积输出每个顶点的偏移

将deep snake加入到目标检测模型中进行实例分割，流程如图b所示。模型首先产生目标框，将其构建成菱形框，然后使用deep snake算法将菱形顶点调整为目标极点，构造八边形轮廓，最后进行迭代式deep snake轮廓调整得到目标形状

Initial contour proposal

论文采用ExtreNet的极点思想，能够很好地包围物体。在得到矩形框后，获取4条边的中心点连成菱形轮廓，使用deep snake对菱形轮廓调整成极点，然后每个极点放置一条边，连接边构造多边形，每个极点的边为其对应的bbox边的，若边超过原bbox范围会被截断。在实际使用时，菱形轮廓输入deep snake前会平均上采样到40个点(有助于deep snake计算)，但损失函数计算只考虑的对应偏移

Contour deformation

对八边形平均采样个点，将上极点作为起点，同样地，GT轮廓对物体边缘平均采样个点，将靠近的点作为起点，一般为128。如果顶点离GT很远，很难直接正确调整，于是采用迭代式地进行deep snake调整，实验采用的迭代次数为3次。
轮廓是目标空间位置的一种扩展表示方法，通过调整轮廓到物体边缘能够帮助解决detector的定位误差

Handling multi-component objects

由于遮挡，一个实例可能包含多个组件，然而一个轮廓只能勾勒出bbox内的一个组件。为了解决这个问题，使用RoIAlign来提取初始bbox特征，然后配合detector来检测组件的box，再对每个box进行上述的轮廓调整，最后结合初始bbox内相同类别的组件输出最终的物体形状。

Training strategy

极点的损失函数如公式3，为预测的极点。

迭代轮廓调整的损失函数如公式4，为调整后的顶点，为对应的GT边缘点。对于检测部分，则采用跟原检测函数一样的损失函数。

Detector

使用CenterNet作为检测器，对于物体检测，使用跟原来一样的设定输出类别相关的box，而对于组件检测，则使用类不可知的CenterNet，对于的特征图，输出的中心点heatmap和的box大小特征图。

9.performace

Ablation studies

Baseline将轮廓视为图结构，然后使用GCN进行轮廓调整，初始轮廓为围绕bbox的椭圆，Arichitecture加入Fusion block，Initial proposal加入论文的轮廓初始化方法，最后是将GCN修改为循环卷积，可以看到每个步骤都对AP有提升。

论文也对比了卷积类型以及迭代次数对结构的影响，可以看到循环卷积的结果比GCN要好。

Comparison with the state-of-the-art methods

论文在不同的数据集上都取得了不错的效果，作者在每个数据集上的训练参数都有点不一样，具体参数可以看看原文

Running time

10.结论

论文提出基于轮廓的实例分割方法Deep snake，轮廓调整是个很不错的方向，引入循环卷积，不仅提升了性能还减少了计算量，保持了实时性，但是Deep snake的大体结构不够优雅，应该还有一些工作可以补

11.参考文献

[1] 彭思达 - 实例分割新思路: Deep Snake (CVPR20'Oral Paper)
[2] Deep Snake: 基于轮廓调整的SOTA实例分割方法，速度32.3fps| CVPR 2020
[3] He, Kaiming, et al. "Mask r-cnn." In ICCV, 2017.
[4] Kass, Michael, Andrew Witkin, and Demetri Terzopoulos. "Snakes: Active contour models." In IJCV, 1988.
[5] Ling, Huan, et al. "Fast interactive object annotation with curve-gcn." In CVPR, 2019.
[6] Zhou, Xingyi, Jiacheng Zhuo, and Philipp Krahenbuhl. "Bottom-up object detection by grouping extreme and center points." In CVPR, 2019.
[7] Zhou, Xingyi, Dequan Wang, and Philipp Krahenbuhl. "Objects as points." In arXiv preprint arXiv:1904.07850, 2019.

网友评论

本文标题：2020-07-07 Deep Snake for Real-T

本文链接：https://www.haomeiwen.com/subject/tiatcktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2020-07-07 Deep Snake for Real-T

Paper reading

1.Title

2.Author

3.单位

4.论文地址

5.数据集

6.摘要

当前的方法在实例分割上的局限性

选择Contour作为Shape representation

7.贡献

8.提出方法和框架

Learning-based snake algorithm

Initial contour proposal

Contour deformation

Handling multi-component objects

Training strategy

Detector

9.performace

Ablation studies

Comparison with the state-of-the-art methods

Running time

10.结论

11.参考文献

相关文章

2020-07-07 Deep Snake for Real-T

R01:一元线性回归

如何使用C#的对象构造器

讲解：Snake Battle、c++、C/C++C/C++|D

2018-04-27

网络图片链接

贪吃蛇 The Snake Game -- 使用Javascri

Modern Snake

Farmer and Snake

A Fake Snake

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读