前几天双十一,一好友激动地给我发来,99元秒杀天猫精灵的链接。我一看,这不是山寨Amazon Echo么。至于为什么这么便宜,就要涉及到人工智能和机器学习的话题了。
现在每个公司都在搞人工智能, 那么如果通过机器学习的途径来实现的人工智能,什么最重要呢? 答案是数据。 有了数据, 机器才能慢慢“学习”。这个数据一定是“大”的才行。 而在两个最重要的方面的数据, 一个是语音,一个是图像,怎么获取呢? 图像很简单了, 摄像头,还有最重要的, 就是美图,所以你去看美图的招股说明书, 它一定是拼命包装成一个人工智能公司, 大家每拍的一张照片, 都是很好的学习素材,所以你会发现,美图的美颜越来越智能了。 那么语音,现在最常用的是什么? 很明显是微信语音, 但是我不知道,也不清楚, 微信是不是在利用这个数据。 除了这个, 电话通话的语音据我所示,还没有大范围用于训练机器。由于美国对个人隐私保护得很严格, 所以美国的各大厂都有自己的“智能语音助手”, 这就是用来获取大家的语音数据的。那么亚马逊Echo和天猫精灵,就是语音助手的一个硬件端而已, 便宜卖给你当然无所谓, 因为你越用,越是源源不断地在给天猫传送训练数据。当然这个倒不一定是多可怕的, 只不过是大厂在构建自己的数据壁垒和训练壁垒而已。 以后小厂训练出来的机器,就完全跟大厂没法竞争了, 这就是马云说的,未来是“数据为王”的时代。
(关于人工智能、机器学习、深度学习和神经网络的关系参见知乎的帖子。)
网友评论