为什么是智能眼镜或者是MR眼镜,而不是VR眼镜,在这篇文章里已经阐述过了https://zhuanlan.zhihu.com/p/85202701。简单来说就是定位不只是一个游戏机,而能成为便携电子产品。(当然,最近有人说可以AR加个封闭罩子就转变成VR了)我一般叫智能眼镜是因为不管是AR/MR都只是为了让眼镜变得智能,这才是核心的问题。只要变得够智能,AR/MR不过是一些功能点而已,所以还是得按需添加。另外,这个其实是从智能手机和功能机演变过来的叫法。
所以智能眼镜首先得是一个正常功能的眼镜(先不考虑带不带近视度数)。这样才能融入你的生活,达到眼镜所应该有的便携性和易操作性。我认为这是2C类智能眼镜能普及的必要条件。所谓融入生活,是指戴着这个眼镜不会对你日常生活造成影响,以及使用它的过程很便捷和快速。而目前市面上的智能眼镜连像手机这样融入生活的程度都还没达到。使用手机的过程其实是非常碎片和方便的,点亮,操作,关闭,切换应用,以及从口袋拿进拿出都很自然地和生活融入,不会对你的生活造成障碍,可以长时间碎片化地使用。理想情况来说,眼镜的便携性和操作性要达到追平甚至超过手机的程度,才能在2C市场获得消费者的使用,并且才可能是长时间佩戴(如果只戴一会儿价值也不大)。
目前影响智能眼镜的便携性和易操作性主要有硬件和软件两块。硬件主要是镜片和电池会极大影响眼镜的便携性,而软件主要是和硬件配合的UI系统影响易操作性。
关于镜片部分,目前市面上的某些光学方案比如自由曲面,棱镜有一个问题就是镜片和眼睛的距离太远了,或者镜片太厚了。所以戴起来的感觉就像把正常的眼镜往前平移了4,5cm,眼镜的鼻托部分以及左右镜架部分都会变得靠近主视野,再加上这类方案还会在镜片上镀黑黑的膜,所以主视野中就会有比旁边更黑的一块,从而阻碍视野。理想情况戴眼镜,镜片应该要尽量靠近眼睛,镜架尽量在人的余光视野中,这样就不会对你日常使用产生障碍,就像隐形眼镜那样。所以目前的一些正式光学方案中波导方案会比较符合正常眼镜的样子,除了旁边的耦合器还是比较大。当然,之后肯定也还会有更便携的方案出现,但这个体验原则是不变的。另外,有的智能眼镜会加遮光罩,避免外界强光导致镜片亮度不足或功耗太高。但这个罩子会因为太大遮挡视野,并且这样的智能眼镜会像头盔那样不易佩戴,不像正常眼镜的形态。我觉得可以在镜片上增加可以根据光强改变亮度的镀膜,像墨镜一样(当然,比墨镜更高级地根据光强改变)。
除了镜片部分,其他的计算和电池要微型化地做到眼镜上也是非常难突破的点。所以目前大家会采用分体式的方式来分离计算和存储到另一个设备上,可以利用已有的手机或是另外带一个“小盒子”作为计算主体,并且电源由这个主体提供。这样眼镜部分只做显示和其他传感器用途。不过这样产生的那根线会成为影响便携体验的一个因素。(现在有些主体是用挂在脖子上或者口袋里的方式)话说苹果2020年要出一款AR眼镜,我觉得以苹果的品味不应该会出有线的方式。所以可能会用无线的解决方案。假设无线的话,那眼镜部分的电池需要应对和主体之间的数据传输以及显示部分的耗电量。所以,这个传输方案一定得比较低的功耗,还要低延迟和高带宽。结合之前iPhone11发布时里面新加的UWB芯片来看,是不是可以大胆地猜测使用的是UWB这种传输方案。虽然目前UWB主要使用的场景多在空间定位上,但是网上介绍这种技术的功耗非常低,带宽高,延迟低,也已有用在无线TV的场景中。其他的传输协议大多满足不了这样的要求。
有了便携的硬件之外,还需要有好用的软件或者说操作系统(其实是系统UI)。我无法准确描绘这个UI具体的样子,但这个UI大概率会借鉴手机和PC的交互模式,但又不同于手机的交互模式。就像手机的UI不同于PC那样。目前能采用的一个简单方法是先兼容原来手机的交互界面(反正是基于Android定制开发),比如在空中显示一个手机的屏幕,可以用手点击,甚至加入一些多屏幕之间的交互等等。但如果需要突破,就要有大的UI框架改变。比如YY一个例子的话,可能没有多层进入/返回的窗口,而是直接多窗口排列,比如朋友圈是单独的一个窗口,摇一摇是单独的一个窗口。有一点需要提的是,关于打字。这个目前在眼镜的UI交互下是个不方便的难点。从台式机到笔记本再到手机,打字的效率一直在降低,并且输入方法都是传统的键盘模式。所以我猜测眼镜UI中必须有打字功能,但可能会进一步被弱化。总之,整体的UI发展的方向是让在眼镜中具有更好的操作用户体验,不阻碍用户的日常生活,比如有时候虚拟屏幕不能挡在用户眼前,可以放在视场角之外,让用户稍转头在侧边显示等等。体验良好的人机交互,是核心竞争力的点。这里面其实还需要硬件的配合,有些交互需要硬件的配合才能达到软件的功能。比如AR/VR中的3DoF和6DoF级别自由度就需要对应的一些传感器进行配合,还需要考虑这些功能的功耗。另外有一个大的可能点在于智能眼镜的语音使用会比手表手机等更方便,可以理解为一个带屏幕的无线耳机,所以语音助手这套交互可以和GUI结合起来,运用多模态交互,产生一些玩法。比如可以运用之前锤子TNT系统里的按住说话,或者目光中的鼠标位置作为焦点来缩小上下文语音信息。还有眼镜的摄像头会比手机之类的摄像头有更多的想象。一方面因为可以多个摄像头来拍摄出3D的效果,并且拍照速度和方便程度都高于手机。另一方面,摄像头在眼镜上,看到的内容和佩戴者看见的真实世界内容可以同步,也就是机器能够看见和听见人看见和听见的内容,这个加上多模态的智能助手(VUI+GUI)辅助人的日常生活会有比较大的操作空间。
关于需求场景,我想说明一下。之前那篇文章有提到过其实从日常电脑使用角度来说,大部分的一些需求功能都可以用2d的形式完成。这里把需求类别情况再总结一下。一类是作为电脑的核心需求。从PC,到笔记本,到手机,作为计算平台的这部分功能其实是想通的。比如上网,多媒体等一些功能重来没有变过,所以这类功能作为核心功能还会延续到智能眼镜,但需要比手机或PC有更好的体验,才能让用户在眼镜上完成这部分功能。比如,智能手机比PC和笔记本有更快,更碎片化地移动(便携)上网体验,虽然笔记本也是完成同样的功能。作为智能眼镜来说,我觉得这块需求的体验要更快更碎片,更精准。另一类是智能眼镜带来的新需求。前一类的目的比较明确,而后一类则是新事物,需要开发。比如,手机的便携性加上移动互联网催生的一些LBS类应用,滴滴打车,地图等是之前笔记本完全做不到的。这些归功于4g网络的速度快,以及添加的一些新的传感器,如GPS等。对应到智能眼镜来说,会需要有新的传感器,以及开发新的手机做不到应用场景。最直接的就是3D相关的功能,当然还有别的一些如智能助手,高精度定位等等。
网友评论