苹果在2011年将Siri结合进iOS 5推出,大概是AI作为一种服务(AI as a Service?)进入大众生活的起源,接下来入场的重量级选手便是Google Now、微软的Cortana,以及今年热门的亚马逊Echo。M.G. Siegler在一篇文章里从使用场景和用户体验的角度剖析过苹果、谷歌和亚马逊三家产品的差异。可不管如何不同,它们都有一个显著的共通点:只有声音,没有脸。
同为民用定位的AI设备,SoftBank的Pepper、Sony的QRIO和ASUS前段时间发布的Zenbo,都附赠一张典型的“机器脸”。为什么?因为这三家都在开发AI内核之余,还尝试赋予它以“机器人”的外形标签。既是“人”,自然要有脸。
21世纪初,CLAMP在周刊《Young Magazine》上连载过《Chobits》。如果说Spike Jonze自编自导的电影《Her》里,斯嘉丽·约翰逊给出了迄今为止最动人的AI嗓音,那《Chobits》中的“Chi”这个角色大概拥有最华丽的日式性感且幼齿的AI脸庞。有趣的是,与“机器人”相比,“Chi”被称作“人形电脑”,这大概也是这部漫画的大陆译名《人形电脑天使心》的由来。假如去掉这张脸,男主角本须和秀树断不会爱上一台“很机器”的东西。
而现实中AI的表情——如果这的确是个真实的用户需求而非工程师的执念的话——似乎可以帮助传递非语言部分的信息,至少UC San Diego的研究人员是这么想的。他们几年前就已经在利用机器学习,训练一张长得颇像爱因斯坦的机器脸运用各种面部表情了。
跳出来看,比起“不要脸”,“要脸”的这种方式,真的更高效,以致于很有必要么?仔细想想,我们就知道其实大部分AI硬件的“脸”在传递信息上起的作用其实很弱。在第169期ATP里,Marco Arment、Casey Liss和John Siracusa坦承他们是以一种“使唤奴隶”的心态来对AI下命令的。从自身经验来看,我相信这亦是大部分人的选择。此类情况下,很难说电子表情能对人机交互起到多大的补强——你会对一个显示“嘴角下弯”表情的设备报以真诚的愧疚并采取相应行动吗?当然不会,因为你知道这是“假”的。那么花费大量成本去显示这个表情的意义又何在呢?如果意义不大,那若是做得像是大阪大学的石黑浩实验室(Hiroshi Ishiguro Laboratories)的介护机器人Telenoid R1那样令人毛骨悚然,岂不是赔了夫人又折兵?
所以,究竟“脸”有多重要?在上述那篇文章里Siegler谈到,虽然Siri和Google Now在教育用户普及用例方面功不可没,但Echo才是真正好用的产品。他用的语汇是“架起了人类与机器对话的桥梁”。但这很奇怪,因为Echo是个顶端发蓝光的黑色圆柱体,本身也是台小机器。
——AI的“脸”,才是这座桥。
对着眼前的空气说话,或者交流对象不是一个活人时,现在的我们多少会有些不习惯。2015年的夏天,在戛纳国际创意节(Cannes Lions International Festival of Creativity)上,我见识了同属石黑浩实验室出品的机器版Matsuko Deluxe。能说会唱且拥有人工皮肤的“她”太过逼真,以致于让我人生中第一次体验到了恐怖谷效应。但无论分辨率或拟真程度如何,AI有“脸”,至少能在下语音命令时让人类的视线有个地方可放。大部分产品模仿儿童面部特征的“五官”设计,也能减少用户使用时的距离感。
这张脸最大的用处,是初期推广AI时教育大众且培养使用习惯。就像幼童学自行车时后轮两边的辅助轮,早先不可或缺,后来变得鸡肋,最终必须拿掉才能骑得更快。“人形”的作用也是类似,Echo的大卖和谷歌新出的AI设备“Home”可以作为佐证。在消弭了用户的心理定势后,面目模糊的AI会更无所不在、更便宜,甚至更加政治正确(虽然一直没有明确性别,但Siri推出时采取女声还是让不少女权主义者感到“助理就该是女性”这样的歧视暗示)。
如果一件新事物在某种程度对于它意欲取代的旧事物进行不必要的外形上的模仿,那它极可能很大程度上仍处于初级阶段。所以从实用主义的角度看,作为人机交互界面组成部分的“脸”无疑是一种正在逐渐变得过时和冗余的设计。同样的判断,我们可以下在智能腕表的圆形表盘(机械表的表盘是圆形,因为这是用指针显示时间的最佳设计)、Telsa电动汽车的伪“进气格栅”和电子书里完全不必要的“页”的概念上。以上现象的存在,皆说明人们尚依赖一座“桥”,才能接受这些新家伙进入自己的生活。
所以,若我们相信“过河拆桥”是人类的天性,那么,终有一天,记忆中的“AI式笑颜”会渐渐远去,最后永远消失不见。也许要到那时候,我们才会在设置闹钟、查看天气和播放音乐之外的场景下,轻轻呼唤AI的名字吧。
本作品采用知识共享署名 4.0 国际许可协议进行许可。
网友评论