监督学习，非监督学习

作者: JerryLoveCoding | 来源:发表于2018-09-27 17:13 被阅读0次

11.25 统计学习方法
第十三章聚类（Clustering）
监督学习——学习笔记
监督学习和非监督学习
吴恩达机器学习笔记-非监督学习
统计学习
统计学习方法概论
ml chapter1机器学习的分类
儿童科学实验套装
About_Machine_Learning_in_action

机器学习的定义是：在没有明确设置的情况下，使计算机具有学习能力的领域。

一个适当的学习问题定义如下：计算机程序从经验E中学习，解决某一任务T进行某一性能度量P，通过P测定在T上的表现因经验E而提高。这个定义姑且称之为ETP。

ETP对于一个跳棋游戏来说，经验E就是程序与自己下几万次棋，任务T就是玩跳棋，性能度量P就是与新玩家玩跳棋时的胜利概率。

在邮件过滤垃圾邮件这个问题中，经验E就是观察用户群手动定义（label email）某些（某类）邮件为垃圾邮件，任务T就是给邮件分类（classify email），性能度量P就是邮箱系统正确归类邮件的概率（corrected classify）。也就是任务T在学习经验E后，会提高P。

学习算法目前最常使用的两类：监督学习（Supervised learning）和无监督学习(Unsupervised learning) 。其他主流的学习算法：强化学习(Reinforcement learning),推荐系统(recommender system)。

监督学习：可以由训练资料中学到或建立一个模式（ learning model），并依此模式推测新的实例。训练资料是由输入物件（通常是向量）和预期输出所组成。函数的输出可以是一个连续的值（称为回归分析），或是预测一个分类标签（称作分类）。是指有目标变量或预测目标的机器学习方法。

(1)回归问题

学习的结果是连续的。例子：买房子时，如果已知房子大小和价格的数据，据此我们可以建立一个二维平面图，横轴代表房子大小,纵轴代表每平价格，这样我们可以通过回归曲线来可以估算预测出其每平的价格（如图回归曲线也有很多种不同的方法，会得到不同的拟合度，该情况下二次函数曲线拟合效果就要优于直线的拟合效果），这就是回归问题的一个例子。

总结:回归问题是对于连续性数据,从已有的数据分析中,来预测结果.

(2)分类问题

目标变量是样本所属的类别，学习的结果是非连续的。例子:目前已有的数据是肿瘤的恶性和良性,恶性打叉,良性画圈.通过一个横轴即可描述该事件.同样也可以二维建模,横轴代表肿瘤大小,纵轴代表受测者年龄,当在图上给顶一个点时,我们要预测的是该受测者的肿瘤是恶性还是良性.本质上我们要找一条线,它能最大可能的分开良性肿瘤点和恶性肿瘤点.

总结:分类问题总可以划分为若干类来解决,处理离散型数据。

非监督学习：在学习时并不知道其分类结果是否正确，亦即没有受到监督式增强(告诉它何种学习是正确的)。其特点是仅对此种网络提供输入范例，而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后，也可以将之应用到新的案例上。直接对输入数据集进行建模，例如聚类。在无监督学习中，所用的样本是没有标签的，你给算法大量的样本数据，要求他找出数据的类型结构

无监督学习的代表：聚类分析，假如给你一堆语音数据，你并不知道这些数据之间的关系，有什么样的联系，经过聚类分析后，可能会给你这样的结果，这个模型给你将数据分为了两类，一类是人的声音、一类是乐器的声音。

网友评论

本文标题：监督学习，非监督学习

本文链接：https://www.haomeiwen.com/subject/nfceoftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

监督学习，非监督学习

相关文章

11.25 统计学习方法

第十三章聚类（Clustering）

监督学习——学习笔记

监督学习和非监督学习

吴恩达机器学习笔记-非监督学习

统计学习

统计学习方法概论

ml chapter1机器学习的分类

儿童科学实验套装

About_Machine_Learning_in_action

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读