SegNet与FCN类似,也移除了全连接层,不同的是,采用了编码器-解码器结构,在上采样和下采样中使用了不同的方法。其网络结构如下:

SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层,最终解码器的输出被送入soft-max分类器以独立的为每个像素产生类概率。
每个编码器由数个蓝色层(卷积层,批归一化层,RELU层)以及一个Pooling层(2x2窗口,步进2,最大池化)组成,输出相当于系数为2的下采样。
最大池化过程中会损失一些信息,因此这里储存了max-pooling indices,保存最大池化过程中的位置信息,用于在上采样的时候进行恢复。
与FCN相比,训练精度更高也更快。
可在http://mi.eng.cam.ac.uk/projects/segnet/进行实验
网友评论