亚马逊echo销售情况似乎不错,据说出货已经近千万台,引得Google去年也搞一个自家版本的home,最近苹果也表达出一些兴趣。
不知不觉,智能语音设备好像成了人工智能切入生活的成熟入门领域。因为echo、home都无法在国内流畅使用,去年我特意买了一个京东的叮咚智能音箱,类似于echo,体验几个月后,觉得这场以语音技术为应用的人工智能竞赛里,大家的奔跑姿势还是有些怪异。
Siri刚出时惊艳大众,给iPhone增值不少。微软抬头看了一眼,然后继续埋头自己玩,心想我研究这玩意比你早N年,等我的出来吓死你们。然后我们看到微软大法相继丢出cortana、小冰,甚至Skype实时语音翻译等大招。
要让高深的AI新生技术飞入寻常百姓家,第一个困难是教育市场,而这可能吃力不讨好。做得早有可能成前浪,起得晚又怕赶不上。苹果选择在手机上用女性语音助理的形象第一个亮相,亚马逊手机卖得一般,不去争这个风头,在屋里转了一圈,把iPhone插上音响时灵光一闪,干嘛还要解锁手机、打开APP、搜索播放这么繁琐,直接对着音箱说话多方便。
刚入手智能音箱那一周,每天回家第一件事是打开它,听着配套APP自己推荐的音乐,如果不是音乐口味偏好特别明显的人,推荐音乐随便也能听听。跨度到3周以上,简单的配套app里推荐的歌曲就显得重复率特别高,导致回家第一动作的宝座开始有些松动。
使用中途,按一下机身上语言键,直接说出想听的歌或者歌手名,准确性、反映都还可以。只是我的场景中,常常是一边听音乐一边做菜,想换歌时,考虑到手上全是水还要先擦干再去按、再对话,也不是一个特别顺畅的交互过程。
无法完全解放双手的语音设备,在双手有空闲时,还要抵挡去拿起手机的强烈诱惑,多少影响了一些设备的使用频率。
现阶段对人工智能的认知,大部分来自「交互」环节,机器能听懂我的话,看起来很像有智慧的东西。语音识别作为核心基础,尽管准确率已经很高,但语义理解上依然面临实用范围的巨大挑战。而理解深度与范围,直接限制了AI背后链接的可用服务类型。
只是听歌这个场景,远不足以支撑我们从一个机器去满足需求。生活中,查天气、交通等相对高频稳定的需求,通过语音形式反馈给我们,对比屏幕信息是有明显劣势的。亚马逊期望的echo购物,更让人觉得有点儿戏。当然,最新版里,自己也加上了一块屏幕。
太多打着人工智能旗号的产品,表现得像个人工智障,最近层出不穷的家庭机器人便是此类重灾区。为了像有智能,语音交互都成了标配(背后不是讯飞就是搜狗百度),支持的反馈类型非常有限且固定,机器能「听」懂的服务类型太少了。
使用频率受限,导致我们很难形成稳定的设备交互路径,没有用AI设备满足具体需求的习惯话,这个东西的价值便隐身在手机之下,变得可有可无。
如果非要给AI穿上语音这件衣服,打扮成漂亮的小姑娘推到大家面前,在现阶段识别都在一个段位的情况下,厂商们其实可以更接地气一些。在我们抛开手机的时候,哪些场景下的需求是确定且稳定存在,先去占领可以形成使用习惯的路径。在某些需求场景下站住了,再图谋更大的发挥空间。
装备一身讲笑话、问天气、查菜谱的万金油技能,但每一个都只能做点表面功夫,成为一个人工智能玩具,还是当担生活中某些方面的快捷帮手,这些产品,带给市场的体验感受,以及让消费者建立起对AI的消费价值认知,亚马逊、谷歌们应该想到诗和远方去了。
网友评论