美文网首页就是杨宗的学习记录
如何区分人工智能、机器学习和深度学习

如何区分人工智能、机器学习和深度学习

作者: 就是杨宗 | 来源:发表于2017-08-05 17:20 被阅读29次

之前在百度知道上回答了这个问题,现在把答案又整理了一下,然后放到简书上,以备今后查询。

一、人工智能

先引用百度百科对人工智能的定义

人工智能是计算机科学的一个分支,这是一门研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能有三个层次,分别是:

1. 计算智能:主要用于求解一般的最优化问题(不是凸优化问题,常为NP问题,不能在多项式时间内解决),由于解空间庞大(不可能采用穷举遍历的方法),为了高效快速地找到优化变量的最优解,采用一些启发式搜索的方法,包括遗传算法、群体智能(蚁群、粒子群)、模拟退火等;

2. 感知智能:让计算机看得见,听得到,包括图像识别、语音识别等;

3. 认知智能:最高一个层次的人工智能,包括自然语言处理等。

人工智能主要有四个研究方向(这个说法来源于腾讯AI Lab官网),分别是:计算机视觉、语音技术、NLP和机器学习。

二、机器学习

机器学习是实现人工智能的一种重要方法,主要包括统计机器学习和深度学习。机器学习通过数据驱动智能,它不对某一具体任务硬编码,而是通过ML算法自动从数据中学习出知识。

大部分机器学习都可以归结为最优化问题,都是通过调整模型参数,使得损失函数(成本函数)最小,然后为了避免过拟合,还会引入正则项来约束(限制)要优化的参数,使得模型参数的解空间(参数向量空间)变小,使得损失函数不会太小。

1. 机器学习分类

机器学习大致可以分成四类,分别是:监督学习、无监督学习、半监督学习和强化学习。

2. 监督学习

监督学习针对有标签数据集,它通过学习出一个模型(其实就是一个函数)来拟合数据(分类算法中就是学习出一个超平面来最好地划分不同类别的样本,回归算法中就是学习出一个函数,它的曲线能最好地拟合数据),按照标签是否为离散值又可以分为两类,分别是:

(1)标签为离散值,则为分类问题,常见的分类算法:logistic回归、KNN、贝叶斯分类器、决策树、SVM、神经网络、GBDT、随机森林等;

(2)标签为连续值,则为回归问题,例如线性回归等。

监督学习学的是一种关联关系,一种映射,统计学习的一个根本前提是训练集和测试集要服从同一个分布,即训练集要和真实应用场景同分布

3. 无监督学习

无监督学习针对没有标签的数据集,它将样本按照距离(特征向量 in 向量空间)划分成类簇,使得类内相似性最大,类间相似性最小。通过观察聚类结果,我们可以得到数据集的分布情况,为进一步分析提供支撑。常见的聚类算法有K-means、高斯混合模型和LDA等。

4. 半监督学习针对只有部分样本有标签的数据集,对于半监督学习我不大了解。

5. 强化学习不大了解。

6. 模型评价指标

这里只讨论监督学习和无监督学习。分类模型的评价指标包括准确率(accuracy,被正确分类的样本占全体的百分比)、精确率(precision,查准率)和召回率(recall,查全率)。回归模型的评价指标主要是损失函数,损失函数太小容易过拟合,不考虑损失会导致模型欠拟合。聚类结果的评价指标只要能够反映类内相似性和类间相似性即可(这里不详细,待我回头补上)。

三、深度学习

深度学习是机器学习的一个分支,说白了就是深层神经网络(DNN),主要用于特征自动抽取。CV中常用的网络结构为CNN,NLP中常用的则为RNN和LSTM(现在注意力模型也得到广泛应用),深度学习在无监督学习中的应用主要是通过自编码机进行特征提取,也就是表征学习,关于深度学习,我也正在学习中。

相关文章

网友评论

    本文标题:如何区分人工智能、机器学习和深度学习

    本文链接:https://www.haomeiwen.com/subject/wbhwlxtx.html