美文网首页
监督学习,非监督学习

监督学习,非监督学习

作者: JerryLoveCoding | 来源:发表于2018-09-27 17:13 被阅读0次

     机器学习的定义是:在没有明确设置的情况下,使计算机具有学习能力的领域。

    一个适当的学习问题定义如下:计算机程序从经验E中学习,解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。这个定义姑且称之为ETP。

    ETP对于一个跳棋游戏来说,经验E就是程序与自己下几万次棋,任务T就是玩跳棋,性能度量P就是与新玩家玩跳棋时的胜利概率。

    在邮件过滤垃圾邮件这个问题中,经验E就是观察用户群手动定义(label email)某些(某类)邮件为垃圾邮件,任务T就是给邮件分类(classify email),性能度量P就是邮箱系统正确归类邮件的概率(corrected classify)。也就是任务T在学习经验E后,会提高P。

    学习算法目前最常使用的两类:监督学习(Supervised learning)和无监督学习(Unsupervised learning) 。其他主流的学习算法:强化学习(Reinforcement learning),推荐系统(recommender system)。


    监督学习:可以由训练资料中学到或建立一个模式( learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。是指有目标变量或预测目标的机器学习方法。

    (1)回归问题

    学习的结果是连续的。例子:买房子时,如果已知房子大小和价格的数据,据此我们可以建立一个二维平面图,横轴代表房子大小,纵轴代表每平价格,这样我们可以通过回归曲线来可以估算预测出其每平的价格(如图回归曲线也有很多种不同的方法,会得到不同的拟合度,该情况下二次函数曲线拟合效果就要优于直线的拟合效果),这就是回归问题的一个例子。

    总结:回归问题是对于连续性数据,从已有的数据分析中,来预测结果.

    (2)分类问题

    目标变量是样本所属的类别,学习的结果是非连续的。例子:目前已有的数据是肿瘤的恶性和良性,恶性打叉,良性画圈.通过一个横轴即可描述该事件.同样也可以二维建模,横轴代表肿瘤大小,纵轴代表受测者年龄,当在图上给顶一个点时,我们要预测的是该受测者的肿瘤是恶性还是良性.本质上我们要找一条线,它能最大可能的分开良性肿瘤点和恶性肿瘤点.

    总结:分类问题总可以划分为若干类来解决,处理离散型数据。


    非监督学习:在学习时并不知道其分类结果是否正确,亦即没有受到监督式增强(告诉它何种学习是正确的)。其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。直接对输入数据集进行建模,例如聚类。在无监督学习中,所用的样本是没有标签的,你给算法大量的样本数据,要求他找出数据的类型结构

    无监督学习的代表:聚类分析,假如给你一堆语音数据,你并不知道这些数据之间的关系,有什么样的联系,经过聚类分析后,可能会给你这样的结果,这个模型给你将数据分为了两类,一类是人的声音、一类是乐器的声音。

    相关文章

      网友评论

          本文标题:监督学习,非监督学习

          本文链接:https://www.haomeiwen.com/subject/nfceoftx.html