美文网首页
单目深度估计系列:DORN论文阅读

单目深度估计系列:DORN论文阅读

作者: 非正经研究生 | 来源:发表于2021-08-20 16:07 被阅读0次

tags: 单目深度估计,论文阅读,DORN

[TOC]


原始论文是:

Deep Ordinal Regression Network for Monocular Depth Estimation Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1

image.png

过往的工作(特指那些 使用 深度 神经网络的:DCNN)方法的3种失败处:

  • 收敛慢
  • 局部解析度不够,就是你在最后的深度图上,看不清很多边缘
  • 网络里面 有许多 重复的 pooling 操作。计算,内存要求多
image

我们提出一些方法来针对上述问题

方法1: SID

背后的想法就是: 远处的就分类粒度粗一些

image

那么,在这个 「SID 远处的就分类粒度粗一些 」的基础上,就能把回归问题 变成 一个 分类问题。

离散化 连续 的 距离 变为 一些 距离间隔。

我们的模型包含什么

分成3个模块

image
  1. 特征提取的模块
  2. 场景理解的模块
  3. 有序回归的模块

特征提取模块

包含:

全面的图片编码器

full-image encoder

image.png

场景理解模块

image.png
ASPP

空洞卷积??

有序回归 模块

这里就是 用到 了SID

image.png

如何完成学习和推断

学习阶段

定义我们特有的损失函数:

image.png

迭代的优化算法,反向传播 ,我们最后就能得到一个 「有序的 label 分类」,每个类就是一个距离,比如:1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离 跟上面 的SID 有关。

推断阶段

有了 : 有序的 label 分类, 就可以进行 距离推断。

用下面的公式:

如何基于 label 分类,来 推断距离的公式
  • 解释一下:

d 尖就是 推测的 depth/ 距离

l 就是 学习到 的label

DORN 的表现很好

在18 年的原始论文里,有这个数据:

image.png

在 21年的 kitti 排行榜,很靠前

image.png

其实,按照 absRel , DORN 排名第一

备注: 指标 解释

image.png image.png

相关文章

网友评论

      本文标题:单目深度估计系列:DORN论文阅读

      本文链接:https://www.haomeiwen.com/subject/hqmtiltx.html