
最近半年负责了一款智能领域相关的产品,主要是通过NLU(自然语言理解)技术,识别用户提供的文本,然后推荐对应的功能或者内容。在负责期间,体验最深的一点就是智能产品的不确定性。有句玩笑话说得好:什么叫智能,就是有时候出现,有时候不出现,就叫智能。这个玩笑话,一方面是对智能产品的总结,智能产品就是在“猜”,猜测用户的意图。至于为什么要猜,因为用户不会真实告诉你想要什么,用户甚至都不知道自己想要什么,所以只能靠“猜”。当然,另一方面其实也是对于智能产品现状的讽刺,目前受限于人工智能的技术限制,现在确实没办法做到非常智能的表现,很多时候我们会戏称为“人工智障”。作为产品经理,这时候不能仅仅是无奈,首先就需要拥抱这种不确定性,因为这种不确定性将会贯穿产品的生命周期。其次,产品需要想方设法通过一些策略来规避不确定性对产品表现带来的影响。
简单聊聊智能产品为什么会存在不确定性,先来看看现在能接触到的智能产品以及背后的技术都有哪些:
· 支付宝的指纹识别、人脸识别:图像识别
· 手机的语音助手:语音语义识别
· 淘宝、今日头条的信息流:推荐系统
以图像识别为例,说说人工智能技术的逻辑:
这些产品采用的技术可以分为以下几种:
监督学习:以水果分类为例子,在我们婴儿时期,我们并不知道什么是苹果什么是梨。是随着我们慢慢学习,然后才认识这两种水果。那么APP怎么识别呢?首先也需要有学习的过程,需要事先知道一批水果是苹果或者梨。然后把这批水果分成两部分,第一部分用来训练我们的识别模型(即学习的过程)。另一部分用来验证(可以认为是考试),当我们验证的效果高于某个值,比如准确率达到99%,我们就可以认为这个模型有效。这个模型就可以后续用来识别苹果或者梨这两种水果了。监督学习的特征在于我们事先知道了一些水果的分类。上述的产品基本都属于监督学习。
无监督学习:无监督学习以聚类为主,比如有两棵树,一棵苹果树和一棵梨树,工人采集完水果之后就随便扔到了树下,这时候要对树下的水果进行分类。由于工人是随便扔的,那么苹果肯定离苹果树比较近,梨离梨树比较近。我们不需要知道水果长什么样子,也不需要知道他们长什么样子,只要算一下水果之间的距离,就可以把水果分成两堆。对于无监督学习,我们并不知道他们的特征,而是依靠他们之间的关系来判定的。
增强学习:阿尔法狗(就是打败柯洁的那个)就是用这种算法的,但是具体比较复杂,有兴趣可以自行了解一下。
为什么人工智能要用这些技术,我们以人脸识别为例,你为什么能识别出一个人?首先你肯定要见过,并且留下过比较深的印象。然后再次遇到的时候,你就会将遇到的人和脑海里的人进行比较,然后达到一定相似度的时候,你就会认出这个人是谁谁谁。
这个过程分为:认识-记忆-遇到-比对-识别,那么对应过来,监督学习的样本可以认为是认识的过程,训练模型就是记忆的过程,为了防止记忆有问题,我们还加了一个验证的过程。最后就是遇到,然后比对和识别,整个流程是类似的。人尚且会认错人,那么模拟人的识别而仿造出来的系统会出错自然也就不意外了。
回到我负责的产品,是一款NLU产品,NLU全称叫自然语言理解,“自然语言”就是指我们说的话。每个人习惯不同,知识水平不同,说出来的话也不同。比如说表达喜欢的话,普通人就一句“我喜欢你”,夏目漱石就会说“今晚月色真好”。这种表达不同带给产品的就是:对于单独的一句话,可以确定它的意思。但是对于表达同样意思的所有话,不敢保证所有的话都能被识别出来,因为无法穷举或者明确定义,所以会带来不确定性。
未完待续。。。
网友评论