#机器人时代的三个关键技术--制造R2D2和3PO,BB8
喊了半个世纪A.I,几十年的机器人技术,一直以来我们见到的机器人要么是笨的要命的机械手,要么是简单的只是个玩具样子的人形机器。
最近很多人看了最新的星球大战 为什么到现在一直没有出现星球大战里R2D2或者3PO那样的机器人?个人观点这样的才能算是大家觉得有用或者是能接受的机器人,机械手只不过是个程序化控制的吊车手臂罢了。
R2D2和3PO 关键性featurelist分析:
- 对周围的物体和个人有分析能力,同时搭载了各种环境感应器能了解到周围的各种可能危险,给主人发出警报。
- 内置一个简单的机器人语言系统,能和其他机器人及懂机器人语的人类做直接的沟通
- 底部有个3轮驱动的驱动器和2个火箭喷射器,可以在地面上随意的移动,速度可控。
- 配备若干个机械臂和抓手,可以实现各种人手完成的事情,如:抓取,投掷等
- 内置语言和语义识别系统,能够识别主人部署的任务
- 所有的更复杂的任务可以由人工智能拆解成以上四个任务
第一个,从人工智能角度来说应该叫机器感知,机器人需要一些列的探测器来探测周围的世界,并对自我和周围的环境形成认识,其中最重要最基础的是视觉和空间感知,这里其实模仿了人类的认识世界的过程。这里一定要感谢下任天堂的wii和微软的xbox,他们让廉价的空间感知在几年内成为现实。然后在感知的基础上做出反馈。举个简单的例子,你走路的时候前面看到一个很大的石头,你会绕过去(暂时不考虑盲人的情况)。目前的视觉感知技术有最近比较火的Google Project Tango和intel的RealSense,他们都根据ToF技术原理通过远近景摄像头来判断距离和大小,或者进行运动跟踪,连大名鼎鼎的Nasa都在国际空间站上利用tango的成果做空间站的扫描。除了这个还有个高端货,就是激光测距仪,相信大家在各种武器装备上见过这货,连最近很火的自动驾驶也在用激光测距仪,测量精度高,速度快。总体来说,这里主要是由视觉传感器捕捉视频或者其他光学型号,然后通过计算机视觉算法在机器人内部建立一个三维的世界来让机器人知道自己所处的环境的情况。
第二个feature,是自然语言识别和语义分析。就是让机器人知道人类在跟他们说什么,最近比较常见的Siri, Google Now这些智能云助理已经可以根据人类的指示做一些比较简单的任务了,不过在国内,由于各种复杂的原因体验不太好,推荐在美国的,说英文的朋友们多体验下。总体来说还不错,骑在墙上试过几次,用我的坡脚的美式英语基本都能听懂,7-8成的概率给的答案和干的事情还比较靠谱。
第三和第四个个是通过把前面机器视觉感知感知到的世界,建立一个3D的世界,设定目标点,然后由计算机驱动电机马达和转向装置,实现机器人在地面上的移动,另外还有一个火箭实现跳跃功能,虽然有点特变但是基本上和平面上的运动没什么太大区别。
第五个,这个比较复杂,不是简单的对话,而是要了解到底人类的命令是什么然后拆解成基本任务,去实现这个目标,可以是移动,或者驱动手臂来实现某个操作。
所有复杂的其他的任务可以由以上四个简单任务组成,由人工智能拆解,找出最好的办法。
就和机器人时代里有一句话一样,分工是为了更好的自动化,最后完全取代人工操作。最近几年类似IBM wason分析系统这样的系统已经可以在《危险边缘》中回答问题打败人类的高手,最近Google的神经网络AlphaGo,可以打败人类专业级选手,以前我们总认为机器人需要个体离线处理问题,这与早期的人工智能领域总是希望通过分析结构化的分析解决问题方式不同,现在的解决方案则是在终端设计比较简单的人工智能处理能力,而把负责的留到云端,做到全世界只用一个大的智能(怎么这里联想到了天网了呢T.T)
最后我们得到了一个得到我们理想中机器人的路径,第一,通过视觉和其他空间扫描感应器,建立空间模型;第二,通过云端的智能处理交互并理解人的需求;第三,根据环境不同设计四足,双足,轮式的移动装置,机械手臂完成抓取和精密操作。
网友评论