美文网首页嵌牛IT观察
关于图像语义分割的总结和感悟

关于图像语义分割的总结和感悟

作者: 时光无声_f622 | 来源:发表于2019-12-11 01:07 被阅读0次

姓名:贺文琪

学号:19021210758

【嵌牛导读】近年来,以深度学习为中心的机器学习技术引起了人们的关注。比如自动驾驶汽车已经逐渐成为可能,但在整个深度学习过程,需要算法识别和学习作为原始数据提供的图像,在这一过程中,应用到了语义分割技术。

【嵌牛鼻子】图像语义分割,全卷积网络

【嵌牛提问】什么是语义分割?它的结构是怎样的?

转载源:https://mp.weixin.qq.com/ssrc=3&timestamp=1575994552&ver=1&signature=wIOst3f1PiZhG8igzlTmxhrJhZLHx5WG3ydQ7QH6uHyp91GMCjerGGvEhmyw4HSvyF29pWaL4R4qmiaUZEuYNFGexnEtgyPU8w*4IzOkwwO4MCNtCjeV8bruIlwtIB6DEniNiu-W1ynXQ1PJNg1oCch0VKU4SCRp6p6NzC5QgU=

【嵌牛正文】

图像语义分割,简单而言就是给定一张图片,对图片上的每一个像素点分类。

从图像上来看,就是我们需要将实际的场景图分割成下面的分割图:

不同颜色代表不同类别。 经过阅读论文和查看PASCAL VOC Challenge performance evaluation server,我发现图像语义分割从深度学习引入这个任务(FCN)到现在而言,一个通用的框架已经大概确定了。即:

FCN-全卷积网络

CRF-条件随机场

MRF-马尔科夫随机场

前端使用FCN进行特征粗提取,后端使用CRF/MRF优化前端的输出,最后得到分割图。

接下来,我会从前端和后端两部分进行总结。

前端

为什么需要FCN?

我们分类使用的网络通常会在最后连接几层全连接层,它会将原来二维的矩阵(图片)压扁成一维的,从而丢失了空间信息,最后训练输出一个标量,这就是我们的分类标签。

而图像语义分割的输出需要是个分割图,且不论尺寸大小,但是至少是二维的。所以,我们需要丢弃全连接层,换上全卷积层,而这就是全卷积网络了。具体定义请参看论文:Fully Convolutional Networks for Semantic Segmentation

前端结构

FCN

此处的FCN特指Fully Convolutional Networks for Semantic Segmentation论文中提出的结构,而非广义的全卷积网络。

作者的FCN主要使用了三种技术:

卷积化(Convolutional)

上采样(Upsample)

跳跃结构(Skip Layer)

卷积化

卷积化即是将普通的分类网络,比如VGG16,ResNet50/101等网络丢弃全连接层,换上对应的卷积层即可。

上采样

此处的上采样即是反卷积(Deconvolution)。当然关于这个名字不同框架不同,Caffe和Kera里叫Deconvolution,而tensorflow里叫conv_transpose。CS231n这门课中说,叫conv_transpose更为合适。

众所诸知,普通的池化(为什么这儿是普通的池化请看后文)会缩小图片的尺寸,比如VGG16 五次池化后图片被缩小了32倍。为了得到和原图等大的分割图,我们需要上采样/反卷积。

反卷积和卷积类似,都是相乘相加的运算。只不过后者是多对一,前者是一对多。而反卷积的前向和后向传播,只用颠倒卷积的前后向传播即可。所以无论优化还是后向传播算法都是没有问题。图解如下:

跳跃结构

这个结构的作用就在于优化结果,因为如果将全卷积之后的结果直接上采样得到的结果是很粗糙的,所以作者将不同池化层的结果进行上采样之后来优化输出。具体结构如下:

而不同上采样结构得到的结果对比如下:

这是FCN结构,也是深度学习应用于图像语义分割的开山之作,所以得了CVPR2015的最佳论文。

当然还有一些其他的结构方法,比如:SegNet/DeconvNet,DeepLab,还有用RNN来做的,还有更有实际意义的weakly-supervised方法等等。

相关文章

  • 关于图像语义分割的总结和感悟

    姓名:贺文琪 学号:19021210758 【嵌牛导读】近年来,以深度学习为中心的机器学习技术引起了人们的关注。比...

  • 我所了解的图像分割

    图像分割是我大二2019年做的东西,这篇文章用来总结。 一、什么是图像分割 分语义【像素级别图像】,实例【分割物体...

  • Unet图像分割

    Unet网络是一种图像语义分割网络,图像语义分割网络让计算机根据图像的语义来进行分割,例如让计算机在输入下面下图,...

  • 图像分割常用指标及MIoU计算

    一、语义图像分割结果定义 语义图像分割结果,可分为True Positive、False Positive、Tru...

  • Learning Deconvolution Network f

    写在前面 由于看其他文章的需要,最近刚看ICCV一篇的关于图像语义分割的文章,作为小白的我是第一次接触图像语义分割...

  • 计算机视觉-语义分割

    什么是语义分割 我们都知道,图像是由许多像素(Pixel)组成,而「语义分割」顾名思义就是将像素按照图像中表达语义...

  • 语义图像分割概览

    摘要:本文讨论如何利用卷积神经网络进行语义图像分割的任务。 语义图像分割,目标是将图像的每个像素标记为所表示的相关...

  • 图像分割

    一、语义分割  图像语义分割的目标是标记图像每个像素的类别。因为我们需要预测图像中的每个像素,所以此任务通常被称为...

  • 【转载】语义分割中的深度学习方法全解:从FCN、SegNet到各

    http://www.sohu.com/a/155907339_610300 图像语义分割就是机器自动从图像中分割...

  • 图像语义分割基础知识整理(CNN,FCN,Unet,CVPR-D

    整理的一些关于图像语义分割,CNN,FCN,Unet等的基础知识同时对CVPR-DeepGlobe路网分割竞赛部分...

网友评论

    本文标题:关于图像语义分割的总结和感悟

    本文链接:https://www.haomeiwen.com/subject/pningctx.html