主要贡献:
- DeconvNet 主要由deconvlution,unpooling,ReLU组成。
2.通过训练好的网络的individual objection proposal获得instance-wise的分割实体。
3.和FCN结合获得了很好的效果。
为什么DeconvNet有效?
因为是对称结构,所以output每个像素与input的class probability相同。
unPooling,FCN只是简单的进行上采样,这样会丢失之前pooling层的位置信息,所以unPooling保留了位置信息。
FCN的deconvolution层的filter被固定了,即学习率设置为零,这样这样就会损失类别的形状信息。因此DeconvNet做出了改变,只需要在deconvolution之后进行crop就可以了。这样就能捕捉到不同层的位置信息。
在较低的层中,我们可以观察到,他得到的是物体整体的但是粗糙的信息,如位置,形状,范围。在高层中就更加复杂。我们可以知道unpooling去追踪原始的位置信息使得结果又更好的结构。而deconvolution则获得更好的分类信息。
inference没有看懂
网友评论