机器学习综述

作者: 艾剪疏 | 来源:发表于2018-05-08 21:41 被阅读243次

机器学习综述
机器学习综述
机器学习专题：综述
基于深度学习的目标检测算法（一）
1.ml_basics
机器学习笔记（一）之综述
机器学习模型应用方法综述
机器学习算法优缺点综述
进击的机器学习 Sencod Day——机器学习算法综述
大数据和机器学习固废行业商业价值

文章主要分为：
一、机器学习基本概念；
二、机器学习发展历程；
三、机器学习分类；
四、机器学习的应用实例；
五、结语。

一、机器学习基本概念

作为实现人工智能的最重要的方法之一，机器学习在近几年的发展趋势可谓是如日中天。在算法的指导下，通过对大量的数据进行训练，分析出其中隐藏的结构或规律，并不断提升算法性能，对事件的发生进行判断或预测。其目标是让计算机学会如何模拟人进行思维和创造，不断的学习新的知识和技能。机器学习在人工智能的各个领域都已得到了广泛应用，如计算机视觉、自然语言处理、推荐系统等等。在互联网发展的大好形势下，机器学习在人工智能领域中也会占据越来越重要的地位。

二、机器学习发展历程

2.1奠定基础的萌芽时期

自第一台通用计算机发明之后，计算机能够帮助人们减轻了很多负担。然而，人们并不满足于仅仅解决那些复杂的运算，还希望计算机能够从事一些“智能”领域方面的工作。1949 年，Donald Hebb提出的赫布理论就标志着机器学习迈出了该领域的第一步。随后，阿兰·图灵创造了图灵测试，其主要思想是，如果一台计算机的思维，让人类无法辨别它是机器还是人，则可以判定这台计算机具有了人类智能^[¹^]。1957年至1969年，各种机器学习算法层出不穷，代表性的有罗森·布拉特设计的第一个计算机神经网络——感知机、维德罗的最小二乘方法、最近邻算法等。

2.2 停滞不前的冷静时期

由于机器学习算法对于计算机的处理速度及内存大小都有较高的要求，且当时计算机技术的发展速度比较缓慢，因此整个人工智能领域都遭遇到了前所未有的瓶颈期。从上世纪60年代中叶到70年代初，机器学习的发展步伐几乎处于停滞状态。

2.3 重拾希望的复兴时期

70年代，人们发现人工智能不光要研究解法，还得引入知识。专家系统的出现使得人工智能的研究走向了新的高潮。专家系统可以预测在一定条件下某种解的概率，由于当时计算机已有巨大容量，专家系统有可能从数据中得出规律。1972年，一款用于传染性血液诊断和处方的专家系统MYCIN研发成功，这个系统是后来专家系统研究的基础。1980年，在美国的卡内基梅隆大学(CMU)召开了第一届机器学习国际研讨会，标志着机器学习研究已在全世界兴起。此后，人工智能的发展更为迅速，并进入了很多商用领域。1986年，美国和人工智能相关的软硬件销售达到了4.25亿美元。诸多大公司引入了专家系统，譬如数字电器公司用XCON专家系统为VAX大型机编程，杜邦、通用汽车和波音公司也进入了专家系统。

2.4现代机器学习的成型时期

进入90年代后，个人电脑的逐渐普及和互联网技术的快速发展使人工智能研究有了新的机遇。传统的专家系统并不具备自主学习的能力，无法完成一些更高级的任务。而机器学习算法能让机器从大量历史数据中学习规律并对新的样本作出判断识别或预测，由此受到了人们的广泛关注。1997年5月11日，超级电脑“深蓝”在国际象棋比赛中首次击败了等级分排名世界第一的棋手加里·卡斯帕罗夫，机器的胜利标志着机器学习进入了新的时代。

2.5 大放光芒的蓬勃发展时期

机器学习发展分为两个部分，浅层学习（Shallow Learning）和深度学习（Deep Learning）。随着深度学习技术发展得越来越成熟，人工智能也正在逐步从尖端技术慢慢变得普及起来。2006年，Hinton和他的学生Salakhutdinov在顶尖学术刊物《Scince》上发表了一篇文章，开启了深度学习的篇章[2]。2016年3月，阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战，以4比1的总比分获胜，从此，大众开始对“深度学习”有了深刻的认知[3]。从医疗、教育、制造业、智能家居到交通，机器学习的发展已在各方面提高了人类生活水平。

三、机器学习分类

按照学习形式进行划分，机器学习可以分为监督学习（supervised learning）、非监督学习（unsupervised learning）以及半监督学习。

3.1监督学习

监督学习是指利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。在监督学习的过程中会提供对错指示，通过不断地重复训练，使其找到给定的训练数据集中的某种模式或规律，当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出，主要应用于分类和预测。常见的监督学习算法包括回归分析和统计分类。

3.2非监督学习

与监督学习不同，在非监督学习中，无须对数据集进行标记，即没有输出。其需要从数据集中发现隐含的某种结构，从而获得样本数据的结构特征，判断哪些数据比较相似。因此，非监督学习目标不是告诉计算机怎么做，而是让它去学习怎样做事情。无监督学习的典型算法有自动编码器、受限玻尔兹曼机、深度置信网络等；典型应用有：聚类和异常检测等。

总之，机器学习的本质是借助算法和计算机强大的运算及数据处理能力，在经过大量的数据训练后，使其发现某种其中的模式或规律，并不断提升自身性能，从而实现对新数据进行准确预测的一门学科。

3.3 半监督学习

半监督学习是监督学习和非监督学习的结合，其在训练阶段使用的是未标记的数据和已标记的数据，不仅要学习属性之间的结构关系，也要输出分类模型进行预测。与使用所有标签数据的模型相比，使用训练集的训练模型在训练时可以更为准确，而且训练成本更低，在实际运用中也更为普遍。

四、机器学习的应用实例

随着人工智能领域各项技术的快速发展，机器学习在各行各业发挥了越来越重要的作用。以下是其中的几个应用实例。

4.1 计算机视觉

顾名思义，计算机视觉是一门研究如何是计算机学会“看”的学科。通过摄像头等视频图像设备将三维世界的事物转变为二维图像信息，然后对二维图像进行分析处理，推断出三维物体的状态信息^[⁵^]。机器学习在这个方面的典型应用包括：人脸识别、车牌识别、扫描文字识别、图片内容识别、图片搜索等等。如2017年1月北京西站开通的人脸识别验票系统，使用的就是人脸识别技术，不仅大大提高了检票速度，减轻人工压力，还能从一定程度上减少出错几率。

4.2 自然语言处理

自然语言处理（Natural Language Processing，简称 NLP）是一门重点研究人与计算机信息交互的自然语言理解的学科。过程是首先研究出应用于自然语言的语言模型，然后在计算机上建立框架实现这种语言模型，之后提出改进方法不断完善这种语言模型，最后将这种语言模型应用于各种实际系统中并探讨这些系统的评测技术。常见应用有语音识别、输入法、机器翻译等。

在自然语言处理方法颇有造诣的谷歌公司，于2018年3月1日正式上线了人工智能学习网站Learn with Google AI，并重磅推出了一门机器学习速成课，其中的交互式教学视频包含了中、英、日、韩、法等多种语言版本，视频讲座中的配音则都是使用机器学习技术生成的，由此突破语言障碍，造福全球的AI学习者。

4.3 推荐系统

迅速发展的互联网科技在给我们的生活带来便利的同时，也造成了信息泛滥的局面，如何从这些海量的信息当中及时地获取我们想要的信息成了当今研究的热点问题。个性化推荐系统作为解决“信息过载”的有效手段受到了人们的广泛关注。

口碑颇好的网易云音乐就是凭借其独特的推荐算法才得以受到众多用户的喜爱。通过挖掘用户的行为记录（如喜欢、收藏、分享等），分析出爱好的音乐类型，从而推荐与其音乐爱好相似的其他用户喜欢的音乐。用户听的歌曲越多，它也会越来越了解你喜好，推荐的音乐也就更符合你的胃口。

五、结语

机器学习是人工智能中一个活跃且充满生命力的研究领域。本文介绍了机器学习发展历程，并对机器学习算法中几种学习方式加以叙述。最后以几个应用实例描述了机器学习在各个行业的应用情况。随着互联网技术的发展，机器学习也将逐渐渗入更多的领域。

参考文献

[1] 刘琳玉.艾伦·图灵:“人工智能之父”的谜样人生[J].机器人产业,2016(03):72-76.

[2] Geoffery E Hinton，Salakhutdinov RR. Reducing the dimensionality of data with neural networks. Science，2006，313(5786):504-7.

[3] 刘知青,吴修竹.解读AlphaGo背后的人工智能技术[J].控制理论与应用,2016,33(12):1685-1687.

[4] 夏天.机器学习及其算法与应用研究[J].电脑知识与技术,2017,13(15):156-157.

[5] 左艳超.基于计算机视觉的头部姿态跟踪技术研究与应用[D].北方工业大学,2017.

[6] 张静.基于自然语言处理的智能识别和智能控制应用[D].南京邮电大学,2017.

机器学习综述
文章主要分为：一、机器学习基本概念；二、机器学习发展历程；三、机器学习分类；四、机器学习的应用实例；五、结语。一...
机器学习综述
https://www.jiqizhixin.com/articles/Recent-Advances-in-De...
机器学习专题：综述
一、常用算法（一）. k最近邻： kNN算法是著名的模式识别统计学方法，是最好的文本分类算法之一，在机器学习分类...
基于深度学习的目标检测算法（一）
-- 目标检测任务综述 - 基于传统图像处理和机器学习算法的目标检测 - 基于深度学习的目标检测 ...
1.ml_basics
1 Part 1 机器学习综述从过去的大量数据中“总结”出来“泛化规律”，用于新数据预测。不同类型的机器学习 1...
机器学习笔记（一）之综述
一、分类监督学习（关注对事物未知表现的预测，一般为训练数据（特征与结果）和测试数据（只包括特征，需要根据训练数据...
机器学习模型应用方法综述
文章发布于公号【数智物语】（ID：decision_engine），关注公号不错过每一篇干货。来源 |数据派TH...
机器学习算法优缺点综述
来源：数据派THU、七月在线转自：Datawhale（Datawhale 目录正则化算法（Regularizat...
进击的机器学习 Sencod Day——机器学习算法综述
什么是机器学习顾名思义，不就是让机器去学习，你溜出去玩的黑科技嘛。嗯，正经点，机器学习我理解是程序通过一系列算法...
大数据和机器学习固废行业商业价值
一、大数据和机器学习的基本概念，历史渊源。综述当前大数据和机器学习应用领域。我的判断是，这两个概念现在已经不是出炒...