现在有越来越多的人开始认同,未来最好的人机交互方式就是自然语言。而且自然语言互动会逐渐摆脱人对着屏幕互动的束缚,因为你对着屏幕,至少你的目光受限,你眼睛要看着屏幕,你做事情就不方便了。而智能互动应该是融入环境的,应该是让人可以很方便地在不影响其它事情的情况之下来互动,有屏幕可以互动,没屏幕照样互动。
所以,越来越多的人认为,未来的入口应该是语音互动的入口。
一、中国的智能音箱市场现状
1. 中国和国外的区别就是有版权问题
不管音乐还是电视,还是听书,都是要有内容支持的。
亚马逊能做,能提供这些版权。因为亚马逊网站本身就是一个很大的图书内容网站,上面也是有大量的影视内容的。
2. 中国的授权机制比较分散
国外新的电影、电视都会主动授权给各个渠道,同时,音乐版权上亚马逊也引入了 全球最大的正版流媒体音乐服务平台,所以也都不是问题了。
但是,这些在中国全是问题。中国的版权比较分散,音乐主要在阿里和腾讯手里;电影、电视就更分散了,需要单独洽谈;图书简直像一盘散沙,分散在各个出版社、出版公司、出版社、作者。
内容分散,你就很难做好服务。
比如科大讯飞的电视盒子中的语音查询,技术方面其实没有任何问题。但是,因为科大讯飞没有内容源,所以往往是我查到的一个内容,科大讯飞不能提供,那它就给我提供一个 APP,让我下载 APP,里面就有我想要查找的内容。结果,几部电影、电视剧下来,智能电视里下载了一堆 APP 。可见这个用户体验是很糟糕的。
其实,这也反映了做语音互动入口的一大难点。
人们会拿语音互动类比于真人互动服务。如果说语音互动做不好,它不如真人能够直接给你答案,那它的体验就会很差。而我们说,搜索就好很多,因为搜索下面其实有很多项结果,它并不是给你一个直接的答案,而是给你很多个选项,你只要其中之一是你想要的就好了。那语音互动不能给 N 个选项,必须要直接给到最好的结果。
二、中国人工智能入口的三种可能性
1. 期待内容整合,版权的授权模式逐渐清晰
据说音乐内容现在已经在开始整合了,阿里和腾讯有协议,要把所有的音乐内容整合起来,将授权模式清晰化,这样的话人人都只要做好智能音箱就可以了。影视内容的囤积原来乐视最好,现在明显是力不从心了,不知道还有没有人能够强力地把影视内容整合出来,而且能够把这些授权做好。
2. 企业自己来做能够控制内容的音箱
因为既然 IP、知识产权有问题,那么就只做我自己拥有知识产权的内容。比如“得到”出个音箱名字就叫“罗胖”,用户在晚上睡觉之前跟这个音箱说:“罗胖,请你把你今天讲的内容给我再讲一遍,行不?”因为目标用户很明确,而且用户目标也很明确,就是听得到上的这些内容。但是,问题是会丧失扩展性,估计你会好意思说:“罗胖,请帮我讲一本书。”但是不好意思说:“罗胖,请帮我把走廊的灯关了吧。”
3. 另辟蹊径
第一,找家居领域的其它的互动需求,比如 MIT 的 Jibo,所谓的“伴随型的机器人”或是“社交机器人”。当然要小心,这个思路容易成为另一个伪需求,就是到底你需要机器人跟你互动什么,必须要定义清晰。比如国外的小爱因斯坦机器人,定位是孩子的一个小老师,能够让孩子从小都学会跟这个人工智能来智能互动,来替代学习机,这是一个家居领域里面另辟蹊径的例子。
第二,公共场所的服务机器人。
无论是家居领域以外还是以内都是窄众需求,就是用户群不广泛,或者是低频需求,不是你天天能用的。如果要变成颠覆性的人工智能入口的话,必须得变成大众型的高频需求。
从未来的角度看,我们都知道这个机会很有可能是巨大无比的,很有可能会出现下一个 BAT,甚至可能是中国出现超越国外互联网巨头的新公司的大机会。
网友评论