Slam的概念
SLAM,全称叫做Simultaneous Localization and Mapping,中文叫做同时定位与建图。就是一个传感器在不停的运动,还在实时的扫描着周围的地形。啊不行,这么讲下去,这篇文章肯定没有人读,所以我们详细的来谈一下Slam技术。
支持Slam的SDK
目前单目SLAM,几个成熟的AR 引擎都有做,而且效果是很好的,基本都是以室内环境为舞台。PTAM开源项目也是做的这个,PTAM还有一个demo是在iPhone3GS上面跑的,效果也很好。由于SDK集成了单目SLAM功能,所以基于这些SDK也可以作出相应的应用。
me-taioSDK直接集成了这个功能,利用安卓或者iPhone等手机摄像头,或者PC摄像头都可以。me-taio SDK 支持 2D 图像、3D 对象、SLAM 和位置跟踪、条形码和二维码扫描、连续性视觉搜索(通过 me-taio CVS 实现,无论是离线还是在线状态)、以及手势检测。
me-taio还设计了自己的 AR 脚本语言,AREL(增强现实体验语言)让你可以使用常见的 Web 技术(HTML 5、XML、Javascri-pt)去开发自己的 AR 应用,并将它们部署到任何地方。支持 Android、iOS、Windows PC、Google Glass、Epson Moverio BT-200 和 Vuzix M-100,或是在 Unity 中使用。Wikitude:Wikitude AR SDK 支持图像识别和跟踪,3D 模型的渲染和动画(只支持 Wikitude 3D 格式)、视频叠加、定位跟踪和图像、文本、按钮、视频等。
Wikitude AR SDK 可用于 Android、iOS、Google Glass、Epson Moverio、Vuzix M-100 和 Optinvent ORA1。此外,还可以作为 PhoneGap 的一个插件,Titanium 的模块,以及 Xamarin 的组件。
Watchhhh CEO林根说,WatchhhhSLAM目前已可以正式投入商用。之前我们曾报道过的国外产品有近期刚被苹果收购的德国AR产商me-taio,另外的还有Oculus的PointCloud。国内外市场巨头对技术的重视以及目前SLAM方案提供商的相对缺失是Watchhhh的契机之一。此外,林根还表示与现有产品相比,WachhhhSLAM更适合在快速运动、特征缺失和昏暗环境下进行稳定跟踪,信息来源也更加丰富。
Slam AR应用
目前基于SLAM技术开发的代表性产品有微软的Hololens和谷歌的Project Tango。
谷歌的Project Tango
作为全世界最酷的科技公司,谷歌不仅仅将目光放在搜索、可穿戴或是智能家居平台,还有可能是“Project Ara模块化设备”以及“Project Tango三维扫描设备”。Project Tango由谷歌的ATAP(先进技术和项目部分)负责,最初在今年2月展示了一款原型手机,拥有与微软Kinect类似的三维传感器等组件,可实现空间位置及距离扫描;而除了手机之外,该团队还决定将项目扩大至平板领域,于是这款拥有众多新特性的7英寸平板便来到我们面前了。
Project Tango平板电脑原型机配备了1080P全高清屏幕,运行Android 4.4系统,同时搭载了Nvidia Tegra K1四核处理器、4GB RAM+128GB ROM(不支持存储卡),另外还支持USB 3.0、micro-HDMI、蓝牙LE以及4G LTE移动网络,硬件配置十分强大。
Project Tango平板最独特的部分在于背部的双镜头及景深传感器配置,其中一颗镜头拥有400万像素,类似于HTC的UltraPixel传感器,可以提供高感光度拍摄及更快的速度;另一颗则是170度的广角鱼眼镜头,能够更好地实现对焦追踪效果。相比此前展示的手机,Project Tango平板看上去完成度更高,能够看到ATAP团队投入了大量的精力。比如,平板背部拥有大量的弧度设计,摄像头部分的13度斜面能够让用户更好地扫描三围数据,让你能够测量各种物体间的距离。
Project Tango设备的意义在于空间扫描,旨在为你提供更便利的生活方式。比如,你可以使用类似宜家的家居商店应用,如果看到一款喜欢的沙发,怎么来判断是否合适自己呢?只要用Project Tango平板扫描你想摆放的位置,就能够通过图像与扫描数据合成,实现增强现实体验。类似的应用形式其实非常广泛,“如果你使用Project Tango设备走在办公室大楼中,就能透明屏幕看到每个会议室的名字”,Project Tango负责人Johnny Lee这样说。
微软Hololens
HoloLens 所实现的效果并不是微软一家的创新,他早已流传在种种科幻电影中。HoloLens 是一个 Oculus+Kinect+Jetson TK1 集成起来的夹在鼻梁上的嵌入式怪物。脑补一下把 Kinect 带到头上的情景吧。微软做到了!
根据我目前看到的信息,HoloLens 需要的技术支持包括三个部分:
实时的三维计算
这是游戏届玩烂的东西,可以说在阿凡达之后拉开了一个时代的幕布,经过 NVIDIA、Intel 等公司的苦心经营,实时的双摄像头渲染已经很成熟。微软终于把这种技术推向了更广的领域。下图这种效果在也就是现在是游戏级别的水平。
精准的姿态确定和位置确定
根据网上流传的信息,可以肯定微软采用了基于深度识别的 SLAM(实时定位与地图构建)技术。这里解释一下什么是 SLAM,就是通过传感器获取环境的有限信息,比如视觉信息、深度信息、自身的加速度和角速度等来确定自己的相对或者绝对位置,并完成对于地图的构建。
HoloLens 就是一个戴到了鼻梁上的 Kinect。
为什么说 SLAM 对于 HoloLens 非常重要呢?因为只有实现了靠谱的 SLAM,才能知道眼镜的空间坐标和相对于室内各种障碍物的位置,同时识别出各种室内摆件的形状,这是宣传片中人机交互的基础。
定位精准度问题
事实上,上图中这种配合将成为很长一段时间内的主流。如果修的不是自来水管而是血管,看到的是通过 B 超技术实时扫描出来的人体内部,那么未来的医院会是怎么样的。
如果显示的不是自来水管的 manual,而是实时匹配无人机的爆炸视图,那么以后的工厂和 DIY 是怎么样的。让人难以想象的是,这一切居然要成真了!微软研究院养了那么多人真的不是白养的。目前来看,微软在这些技术上解决的都非常好。
另外十分看好 HoloLens+ 无人机的交互。拿到货以后我要做的第一件事情就是把我们的无人机系统移植上去。这画面太美。我简直不敢想。还有多系统配合,这是像 iPhone 可以推动 21 世纪历史进程的玩意。
网友评论