NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation
https://arxiv.org/abs/2203.01502
https://weihaosky.github.io/newcrfs/
第三方开源:https://github.com/zhyever/Monocular-Depth-Estimation-Toolbox
CVPR2022
从单个图像估计准确的深度是具有挑战性的,因为它本质上是模糊的和不适定的。虽然最近的工作设计了越来越复杂和强大的网络来直接回归深度图,但我们选择了CRF优化的路径。由于计算昂贵,CRF通常在邻域之间执行,而不是整个图。为了充分利用完全连接的CRF的潜力,我们将输入拆分为多个窗口,并在每个窗口中执行FC CRF优化,这降低了计算复杂性并使FC CRF可行。为了更好地捕捉图中节点之间的关系,我们利用多头注意力机制来计算多头势函数,该函数被馈送到网络以输出优化的深度图。然后,我们构建了一个自下而上的结构,其中该神经窗口FC CRF模块用作解码器,视觉Transformer用作编码器。实验表明,与以前的方法相比,我们的方法显著提高了KITTI和NYUv2数据集上所有度量的性能。此外,所提出的方法可以直接应用于全景图像,并且在MatterPort3D数据集上优于所有先前的全景方法。
网友评论