1 语义分割常用指标
(1)像素准确率(pixel accuracy, PA):分割正确的像素总量除以像素总数。
(2)平均像素准确率(mean pixel accuracy, MPA):对每个类计算PA,然后对所有类的PA求平均
(3)平均IOU(Mean Intersection over Union, MIOU ):对每个类计算真值与预测值的交并比(IOU),然后对所有类别的IOU求平均值
(4)频权交并比(Frequency Weighted Intersection over Union, FWIoU):对MIOU的改进,根据每个类出现的频率为其设置权重。
2 RGB-D语义分割数据库
(1)NYUDv2 dataset : 共有1449对密集标注的RGB-D图像,其中795对作为训练集,654对作为测试集,共40个类。
(2)SUN RGB-D dataset :共10335对标注图像,5285对作为训练集, 5050对作为测试集, 共38个类。
3 结果汇总
NYUDv2 | SUN | RGB | -D | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
PA | MPA | MIOU | FWIOU | PA | MPA | MIOU | FWIOU | 训练尺寸 | 干网络 | 时间 | 发表于 | 备注 | |
RedNet[1] | - | - | - | - | 81.3 | 60.3 | 47.8 | - | 480x640 | ResNet-50 | 2018 | arxiv | |
RedNet[1] | - | - | - | - | 81.3 | 60.3 | 47.8 | - | 480x640 | ResNet-50 | 2018 | arxiv | |
D-Refine-152[2] | 74.1 | 59.5 | 47.0 | - | 80.8 | 58.9 | 46.3 | - | - | resnet | 2018 | ICPR | |
SCN[3] | - | - | 49.6 | - | - | - | 50.7 | - | resnet152 | 2018 | IEEE TRANSACTIONS ON CYBERNETICS | ||
LS_deconvNet[4] | 71.9 | 60.7 | 45.9 | 59.3 | - | 58.0 | - | 417 × 417 | Deeplab | 2017 | CVPR2017 | ||
参考文献
-
RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation, 2018 ↩ ↩
-
Depth-assisted_RefineNet_for_Indoor_Semantic_Segmentation,2018 ↩
-
SCN: Switchable Context Network for Semantic Segmentation of RGB-D Images, 2018 ↩
-
Locality-Sensitive Deconvolution Networks with Gated Fusion for RGB-D Indoor Semantic Segmentation,2017 ↩
网友评论