机器学习的动机与应用
Background:说自己对Machine Learning一无所知好像又知道一点儿,说自己会机器学习又觉得自己还没入门,缘由在于一直学习它的反复,浅层学习并且半途而废从来没有坚持下去。要去找找翻一翻学习它的笔记估计从大三开始就记起过,看过西瓜书,还看过Deep Learning的花书,也看过Andrew Ng的视频,可是从未看完过也没深究过,现在想来即使是一些用过的算法也道不出太多的所以然来。于是乎,想抓住最后一点暑假的尾巴,也是唯一空闲的还不被众事所困扰的一段时光了,一定要做到machine learning的入门工作,采用写电子笔记和纸质笔记相融合的这样一件富有仪式感的事来督促自己完成这一任务,不然每天睡觉也忒有点无聊和浪费美好时光了吧。
前言:本文集的参考资料主要来源于StanFord University的Andrew Ng的CS229视频教程、附带的课堂讲义、一位网上大佬的中文笔记和NanJing University的周志华的西瓜书。另外由于数学渣,还会参考LanZhou University的高等数学一二册和线性代数、TongJi University的概率论、Tsinghua University的数值分析以及张宇考研数学。
1. The definition of machine learning
Arthur Samuel(1959): Field of study that gives computers the ability to learn without being explicitly programmed.
Tom Mitchell(1988): A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. (假设用P来衡量一个计算机程序在某类任务T上的性能,若一个程序利用经验E在T中任务上性能得到了改善,则关于T和P,该程序对E进行了学习。)
周志华: 机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。
2. Supervised learning
训练数据若带有标记信息,则称为监督学习。
分类和回归是监督学习的代表。在分类问题中AndrewNg以肿瘤大小判定良恶性举例,在回归问题中其以房子大小得到房价举例。
3. Unsupervised learning
训练数据不带有标记信息,则称为无监督学习。
聚类是无监督学习的代表。在这里AndrewNg以使用聚类算法进行肿瘤分类和划分图像区域构建3D世界为例。
4. Semi-supervised learning
让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,则称为半监督学习。
半监督学习中常用的两种假设是“聚类假设”(cluster assumption)和“流形假设”(manifold assumption)。前者是假设数据存在簇结构,同一个簇的样本属于同一个类别;后者是假设数据分布在一个流形结构上,邻近的样本拥有相似的输出值。二者本质都是“相似的样本拥有相似的输出”。
主动学习:一小部分标记数据,然后从未标记数据中挑选出对改善性能作用大的数据对专家进行询问得到标签放入标记数据中,之后利用这些数据构建出模型用以预测待测数据。
半监督学习划分为纯(pure)半监督学习和直推学习(transductive learning)。
a. 纯半监督学习:一小部分标记数据和大部分未标记数据,利用这些数据训练出模型用以预测待测数据。这是基于“开放世界”的假设,希望得到的训练模型用以预测训练过程中未观察到的数据。
b. 直推学习:一小部分数据和大部分未标记数据,利用这些数据训练出模型用以预测那些为标记数据。这是基于“封闭世界”的假设,希望对学习过程中观察到的未标记数据进行预测,目的在于在这些未标记样本中获得最优泛化性能。
5. Reinforcement learning
机器处于某个环境下处于某个状态,当被施予某个动作时会得到一个反馈,如果是希望得到的反馈则获得的奖赏高,反之则低,在整个学习任务中要找到能使长期累积奖赏最大化的策略,这个过程就是强化学习。
小憩一会儿
机器学习名字的由来:
1952年,Arthur Samuel(1901-1990)研制了西洋跳棋程序,具有自学习能力,通过对大量棋局的分析逐渐辨识出当前局面下的“好棋”和“坏棋”,从而不断提高弈棋水平,这个程序使用了强化学习技术。Samuel发明了“机器学习”,将其定义为“不显示编程地赋予计算机能力的研究领域”。
网友评论