一、语义分割
图像语义分割的目标是标记图像每个像素的类别。
因为我们需要预测图像中的每个像素,所以此任务通常被称为密集预测。

1.语义分割之U-Net网络
- 网络结构

-
Transposed Convolution层
普通的卷积层和池化层是为了缩小输出的尺寸,而Transposed Convolutions的作用正好相反,是为了增大图像的尺寸,同时保留位置的信息。
up conv.png
Transposed Convolution层是图像过采样的最佳选择,它通过误差向后传递算法来学习最佳的权值,使得低分辨率的图像可以转换为高分辨率的图像,效果极佳。

- Conv2DTranspose演示

- Conv2DTranspose存在的问题

2.语义分割的应用
- 自动驾驶
- 医学图像处理
- 地理感应
- 精准农业
二、实例分割
比语义分割更进一步,除了像素级分割,还需要分别对类的每个实例进行分类。例如,图中有3个人,每个人实例都需要都被分割出来(以不同颜色)。

网友评论