CCAI 2019｜张正友：机器人走向自主化，“人机共生”时代将

作者: 人工智能前沿讲习 | 来源:发表于2019-07-23 14:36 被阅读2次

CCAI 2019｜张正友：机器人走向自主化，“人机共生”时代将
人机共生的时代
2022-06-20
《人机共生》
CCAI 2019｜史元春：人机交互，要从精准走向模糊
首页2019北京创客机器人展览会（少儿智能）
20190215
人机共生时代人类会依赖AI决策？
【177】《好老师养成笔记》· 5：人工智能时代（人机共生下财富
数控车床机器人加工的常见4种分类

腾讯 AI Lab 及腾讯 Robotics X实验室主任张正友博士是大会程序委员会主席之一，是著名计算机视觉和多媒体技术专家，ACM和IEEE会士。

在立体视觉、三维重建、运动分析、图像配准、摄像机自标定等方面，张正友都有开创性贡献。他发明的平板摄像机标定法在无人驾驶、机器人以及视觉等领域，被全世界广泛采用，人们称之为“张氏方法”。

学术贡献之外，他在微软任职期间带领的研究团队在Windows、Office、Xbox、Kinect、Skype for Business等多款产品里都有贡献。

在人工智能发展引得举世瞩目的今天，执掌两大实验室的张正友，对人工智能与计算机领域有着怎样的思考呢？我们一起来了解。

今天是人工智能和机器人的初春

近年来人工智能在深度学习领域取得了令人振奋的进步：围棋智能AlphaGo不费吹灰之力，便横扫人类两大顶尖棋手柯洁和李世石；在语音识别领域，人工智能的准确率也已经大幅高于人类；此外，人类识别技术帮助警方抓获逃犯的新闻不时见诸报道……

那么，人工智能的春天来了吗？

对此，张正友直言要“泼冷水”。在他看来，人工智能和机器人还有很长的路要走，现在仅仅是人工智能和机器人的初春，还会遭遇“寒流”。

他曾在公开场合举过三个例子，解释当前人工智能的局限。

第一个例子是2018年11月，宁波街头的闯红灯抓拍系统“逮到”了格力电器董事长董明珠，街头曝光台电子屏上出现了“董小姐”的头像！

可实际情况是，当时一辆车身上绘有董明珠广告的公交车刚好驶过，系统无法区分画像与真人，于是造成了“乌龙”。

第二个例子是语音翻译。张正友发现，无论是谷歌还是百度，都无法准确翻译出“前门到了，请从后门下车”这句话，哪怕他改成了“前门车站”也无济于事。

还有一个例子是索菲亚机器人，张正友说，“她”的对话都是通过预先设计好的场景来实现的，还远远达不到与人交互的水平。

因此，从事30多年人工智能研究的张正友表示，以眼下机器人发展的程度来看，自己并不担心“机器人消灭人类”这样的事情会发生。

不久的将来会是“人机共生”的时代

尽管提出了当前人工智能发展存在的一些局限，张正友还是认为，不久的将来我们就将迎来人与机器人共生的时代。

一方面，从最早的大型计算机，到个人电脑的普及，再到接下来互联网兴起以及智能手机的出现，计算设备经历了巨大的演变过程，可穿戴式或陪伴设备的未来也值得期待。伴随着这些演变，机器的计算能力从固定的时间、程序、地点逐渐向移动化、连续化、个人化转变，计算正在变得无处不在，人们可以随时随地获取想要的信息。

另一方面是感知技术的升级。人们最早使用的还是打孔的卡片，后来慢慢出现了鼠标、键盘、摄像头、触摸器等等，如今我们的智能手机上有了更多的传感器，现代设备已经变得越来越主动、个人化和多模态。张正友提出，如果把传感器从手里、口袋中解放出来，下一代机器人的雏形便随之浮现。那么人机共存、共创和共赢的时代必将来临。

在今年5月的腾讯全球数字生态大会上，腾讯也重申了对于基础研究的重视，立志攻克价值与挑战并存的两个核心大问题：第一是多模态研究，探索未来人机交互方式；第二是通用人工智能，打造一种通用、普适、终极的算法，最大程度释放技术原力。

过往大家主要是沿着感知、认知到决策不同方向发展。感知，如人脸和语音识别处理；认知，如实时翻译、智能对话、阅读理解等；决策，如围棋AI、农业AI等，需要处理大数据并得出结论与建议。如果类比人类智慧，感知、认知和决策其实不可分割，是一个协同、平衡和制约的问题。当我们不再只对这三个方向做单一优化，而是进行跨学科、跨模态的交叉研究时，多模态研究就能让机器用感知判断人类情绪，用认知判断意图，并进行更复杂的分析与决策，从而不断向真正的人类智慧靠近。通过多模态研究，我们可以探索面向未来的人机交互方式。

机器人从自动化走向自主化

张正友执掌的腾讯Robotics X在大量调研后发现，目前全球机器人的本体研究上有六大方向与趋势：

第一，仿生化，比如蛇形机器人，让机器人能适应复杂的工作环境；

第二，灵活操控，只有实现灵活准确的抓取和操控，机器人才能做更有用、更复杂的运动；

第三，触觉技术，机器人需要实时反馈、精确的感知操控反馈，才能实现更有效的自主；

第四，多机器人协同，机器人之间要避免碰撞，高效协调它们之间的协作；

第五，人机交互，机器人与人要能达到非常自然的情感交流和安全的交互；

第六，医疗辅助，机器要能增强人的体能，帮助残障人士重获生活便利。

在张正友看来，这些趋势都指向一个共同的方向——更自主的机器人。以前人们讲的工业机器人更多是一个自动化的机器，它被预先设计好了之后就会执行重复运动；现在的机器人则开始慢慢往自主方向发展，自主的目的就是要机器人在有很大不定性的动态环境里，自主决策需要做的事情。

机器人技术突破点：A2G理论

机器人的发展要面向未来，需要在哪些方面取得突破？

张正友的回答是：A2G理论。

A2G即ABCDEFG，每个字母代表一个方面。

A代表AI，智能。机器人必须要能看、能说、能听、能理解，才能与外界交互，完成它的目标。

B代表Body，本体。不同的本体决定了机器人的能力，比如蛇形机器人能穿过狭窄的通道，在一个复杂的环境中开展作业。

C是Control，控制。机器人要能自动控制，在没有人直接参与的情况下，可以根据外界情景变化对自身进行精准且不间歇地控制，并同时处理多项命令。

A、B、C代表了人工智能的基础能力。那我们该如何评价呢？张正友认为，要从力量、灵巧、快速、准确和优美的角度评估机器人。

接下来的D、E、F、G，是机器人需要具备的更高智能或系统。

D代表Developmental，机器人需要发育学习。在张正友看来，这与当前火热的深度学习并不是一个概念。他指出，机器深度学习出来的能力依然是固定的，而人是通过与周围环境交互实现学习的，能力会越来越强大，如何让机器也具备这样的进化能力是需要研究的。

E代表EQ，即与人的情感交互。未来人和机器要共存，这就要求机器要对人也友情感上的理解，而且还要以适当的方式表达出来。

F是指FlexibleManipulation，灵活操控。未来我们需要的，不是电影里身披铁甲战衣的钢铁机器战士，而是对人类不构成伤害威胁的机器人，因此人造皮肤，或者能够实现灵活操控的高精度触感传感器就显得非常重要。

G是指Guardian Angel，守护天使。机器人的最终目的是要服务人、保护人，它不应该被视为独立的个体，而要与周围环境和传感器结合，还要和云结合，即使你的家庭成员或者朋友不在边上，你也能够很快跟他们取得感情交流。

结语

以“Make AI Everywhere”为愿景，腾讯 AI 在医疗、农业和公益等应用领域取得不错进展，也正在通过游戏、机器人和多模态等研究实验平台探索解决AI终极难题——通用人工智能——的道路。展望未来，我们将继续通过前沿研究提升AI的认知、决策和创造力，深耕行业，拥抱消费互联网与产业互联网，做好“数字化助手”标配，提供更好的技术、工具与服务，为人们的日常生活和社会发展带来更多美好便利。