美文网首页程序员
立体视觉—1个历时半年的项目终于完成啦!

立体视觉—1个历时半年的项目终于完成啦!

作者: AI专栏的站长 | 来源:发表于2020-02-29 12:13 被阅读0次

1. 立体视觉是什么?

人类通过眼睛感知世界、获取信息。人类获取信息的方式有很多种,可通过眼睛、耳朵、触觉、嗅觉、味觉等,但我们接受到的绝大部分信息都是通过视觉的方式获取到的。由此可见,视觉系统在人类的生存、生产、发展中起到了极其重要的作用。随着计算机技术、智能机器人等的广泛研究与应用,不少科学家尝试将人类视觉系统功能赋予机器。让机器获取与人类一般的视觉能力,是许多科研工作者长期以来的追求。目前,虽然还不能够使机器获得与人类一模一样的视觉感知能力与认知能力,但自上世纪中叶以来,各种视觉技术理论与图像处理技术得到了飞速的发展,我们正朝着这一目标不断前进。

立体视觉是计算机视觉的重要组成部分,而双目立体视觉又是立体视觉的一个重要分支。它是基于两幅图像的,通过模拟人眼视觉的方式,由两个视点对同一个物体进行观察,具体是由不同位置的两台相机(或一台相机经过旋转和移动)对同一场景进行拍摄,然后通过三角测量的原理来计算空间点在两幅图像中像素间的视差,根据视差来恢复目标物体的深度信息,最后可以根据深度信息来恢复物体的三维形状。

作为一个完整的计算机视觉三维重建系统必须包含以下几个部分:图像采集、图像预处理、相机标定、特征点提取和立体匹配、深度信息计算、三维坐标计算以及后处理等。比较关键的技术有相机标定技术、图像立体匹配以及空间点的三维坐标计算三项。

2. 立体视觉原理

立体视觉原理示意图如下图所示,右眼能看到被视物体的右侧,左眼能看到被视物体的左侧,左右眼视网膜上形成2副存在视差的图像,经大脑融合处理后,大脑根据视差判断物体的空间位置关系,使人产生立体视觉。

在机器视觉中,以仿生学原理获取视差图像,人类立体视觉获取的视差以角度表示,计算机获取的视差大小则以2 副图像之间的像素坐标差值表示。机器视觉中,需通过3D显示设备呈现立体景象,根据物体远近表现的视差,分为正视差、负视差和零视差,并以此形成立体感。

3. 左右视图

左右视图即来自于左右眼睛或摄像头的图像,我们网路的训练用到的左右视图是来自Middlebury数据库中供立体匹配算法研究的一组参考图像。

4. 深度学习算法

我们采用了基于全卷积神经网络的立体匹配,利用大量的图像对与真实视差图像进行训练,学习图像对到视差图的直接映射。视差平滑假设,然后解决一个优化问题。卷积神经网络可以进行端到端的学习,立体匹配则要求进行像素级别的视差计算,一般的卷积神经网络的无结构输出结果无法满足要求。我们通过全卷积神经网络可以对任意尺寸的图像进行输入,进行端到端的学习,进行像素级别的预测,全卷积网络结构采用双塔式网络结构,去掉全连接层,输入为同一场景对应的两张的图像,输出为视差图。

5. 网络结构图

我们使用全卷积神经网络进行光流预测,基于全卷积神经网络的立体匹配网络结构采用如图所示,整个网络采用双塔式网络结构。因为双目立体匹配输入为两张图像,此网络输入具有两个分支,输入分别为参考图像r与匹配图像m,r与m是同一场景不同视角的两幅图像,再分别经过三层卷积(具体层数可以进一步调节)与池化层变换进行特征提取,再把两个分支的特征图首尾相接进行聚合,形成双塔式结构。把聚合的特征图继续执行卷积与池化操作,进行更高层次的抽象语义特征提取,最后结合高层的语义信息与低层的位置信息进行提炼(refinement ),既可以获取语义信息,又可以保持更好的空间结构,获取更加精准的预测,符合人脑生物特性,通过这个双塔式全卷机神经网络,进行像素级别的预测,可以直接进行图像对到视差图的映射。

6.传统立体匹配算法

Census

变换在实际场景中,造成亮度差异的原因有很多,如由于左右摄像机不同的视角接受到的光强不一致,摄像机增益、电平可能存在差异,以及图像采集不同通道的噪声不同等,cencus方法保留了窗口中像素的位置特征,并且对亮度偏差较为鲁棒,简单讲就是能够减少光照差异引起的误匹配。

实现原理:

在视图中选取任一点,以该点为中心划出一个例如3 × 3 的矩形,矩形中除中心点之外的每一点都与中心点进行比较,灰度值小于中心点即记为1,灰度大于中心点的则记为0,以所得长度为 8 的只有 0 和 1 的序列作为该中心点的 census 序列,即中心像素的灰度值被census 序列替换。经过census变换后的图像使用汉明距离计算相似度,所谓图像匹配就是在视差图中找出与参考像素点相似度最高的点,而汉明距正是视差图像素与参考像素相似度的度量。具体而言,对于欲求取视差的左右视图,要比较两个视图中两点的相似度,可将此两点的census值逐位进行异或运算,然后计算结果为1 的个数,记为此两点之间的汉明值,汉明值是两点间相似度的一种体现,汉明值愈小,两点相似度愈大实现算法时先异或再统计1的个数即可,汉明距越小即相似度越高。

7. 结果误差率

我们深度学习算法的实验结果的最终误差率只有7.25%!!!

8. 三维重建结果

9. 算法源码

(1)、深度学习算法源码截图:

(2)、传统立体算法源码截图:

SAD

Census

DP

想要项目源码的,可以关注小编公众号,并在后台回复【立体视觉】即可领取:

小编也带你手把手装各种实验环境哦,可以添加站长微信互相交流:

相关文章

  • 立体视觉—1个历时半年的项目终于完成啦!

    1. 立体视觉是什么? 人类通过眼睛感知世界、获取信息。人类获取信息的方式有很多种,可通过眼睛、耳朵、触觉、嗅觉、...

  • 爱惹麻烦的小机灵鬼

    今天下班之后去团建了,历时三个多月的项目终于要结束了,要做新的项目啦,开心。做新项目才能有钱分嘤嘤嘤。 终于吃到了...

  • 终于完成啦

    雪精灵?‍♂️小毛衣

  • 终于完成啦

    今天我开始画学校里布置的科幻画作业了,要用四开的纸来画的,也就相当于两张八k的纸,四张A4纸,反正是很大的一张,...

  • 终于完成啦

    花了差不多一个星期,终于把mpc 搞定了,虽然无人驾驶上还会有抖动,但基本可以了,不容易。 今天感觉音乐还是要认真...

  • 今日上线!颐茶引领味蕾新态度,赴一场花与茶的约会!

    颐茶项目在历时半年的准备工作之后,终于在今天正式上线了! 在项目初创阶段,颐茶便已明确区别竞争对手,找到属于自己的...

  • 历时半年,终于把它看完了

    《行为设计学:零成本改变》 2019年下半学期接近尾声时,把它从学校图书馆带回寝室,那天晚上看的太入迷了,却因...

  • NEW YORK

    历时几天,终于完成 グッ!(๑•̀ㅂ•́)و✧

  • 板绘/线稿

    历时三天,终于完成线稿部分(´-﹏-`;)

  • 今天终于完成啦!

    哎呀,今天真开心! 今天我总算把税务的年度汇算清缴申报完成了! 一直拖着没完成,自己心里不好过,而且焦虑,现在一完...

网友评论

    本文标题:立体视觉—1个历时半年的项目终于完成啦!

    本文链接:https://www.haomeiwen.com/subject/kjxphhtx.html