智能助手中主要应用的技术是深度学习技术,那么这到底是一种什么样的技术?如何应用呢?今天我从外行人的角度做一下解析。
一、人工智能vs机器学习vs深度学习
首先我们看下这几个热词之间的关系,首先我们给出维基百科中这三个名次的解释。
1、人工智能(英语:Artificial Intelligence,缩写为 AI)亦称机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序的手段实现的人类智能技术。
2、机器学习
机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。
3、深度学习
所谓深度学习,狭义地说就是“很多层”的神网络,在若干测试和竞赛下,尤其涉及语音、图像等复杂对象的引用中,深度学习取得优越的性能。
三者的关系可以用下图表示。
深度学习在智能助手中的应用1、人工智能是一种产品
2、机器学习,是实现人工智能的重要方法。
3、深度学习,是实现机器学习的技术。
二、深度学习的应用
我们用机器算法来解析数据,学习数据,并从中做出理智的判定。根本上讲,深度学习用于创建可自我学习和可理智判定的人工“神经网络”。
目前深度学习主要应用在以下领域:
a. 计算机视觉:我们将其用于像车牌识别和面部识别等应用。
b. 信息检索:我们将 ML 和 DL 用于像囊括文本检索及图像检索的搜索引擎等应用。
c. 市场营销:我们在自动电子邮件营销及客户群识别上使用这些学习技术。
d. 医疗诊断:它在医疗领域也有广泛的应用,像癌症识别及异常检测等应用。
e.自然语言处理
针对类似情感分析、照片标签生成、在线广告等应用。
从此可见,智能助手首要要解决的技术难题是自然语言理解,而深度学习应用在自然语言理解可以解决自然语言特性(如多样性、鲁棒性等)多个问题。
深度学习在智能助手中的应用根据哈工大车万翔教授的介绍,自然语言理解中的几个模块的发展主要得益于深度学习技术这两年的迅猛发展。
意图分类可以看成是文本分类,而且是短文本分类问题。早期采用SVM等线性分类器,最近主要采用深度学习方法,比如CNN或者CNN-LSTM。有人说深度学习需要大数据,对话领域数据不多,为什么还采用深度学习技术呢?这主要归功于预训练模型,使得深度学习在只有较少数据的情况下,仍然可以取得比较好的效果。
语义槽填充是要识别句子中规定好的语义槽的值。可以看成序列标注问题,即标注出序列中每个词的标签,如出发地的开始或者出发地的继续等。传统的序列标准模型是CRF,现在双向LSTM之后还可以再加CRF模型。
对话管理负责识别出下一步采用什么动作。这个问题比较麻烦就是我们很难标注出数据,告诉对话系统每一步采用什么动作,因为很多时候没有标准答案。这是强化学习擅长解决的问题。早期对话管理的研究往往采用基于规则的方法,后来出现基于有指导,即标注每一步所谓的标准动作,目前研究主要集中在基于强化学习的方法,其中的奖励可以是对话轮数、任务完成情况等。
最后是对话生成,通常采用基于模板的简单方法,也可以采用语言模型,目前也出现了基于深度学习的模型。与之前基于序列到序列的深度学习模型不同,这里采用的是状态到序列的模型。基于深度学习的模型还多处于研究阶段,实际应用中还是多采用基于模板的方法。
三、关于深度学习的思考
从现在网站中各种企业高校的官宣,以及各种论文中可以看出,深度学习对于自然语言理解已经有很大推进。但是自然语言理解目前解决的仍是数据标注和训练的问题,并不能解决推理的问题,也就是如果超出了深度学习训练的domain,智能助手就会错误理解意图。
因此可以看出,深度学习不能真正解决自然语言理解的问题,现在不行,以后也不行。
网友评论