美文网首页
监督学习简介

监督学习简介

作者: 巴拉巴拉_9515 | 来源:发表于2017-07-21 14:08 被阅读0次
戈黛娃夫人

监督学习
通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力

监督学习其实就是要有两个数据集,一个train,一个test。通过train研究变量间的关系,然后把模型套用到test中,预测结果

01、决策树
DT(决策树)构建一棵树,在节点按照某种规则(一般使用信息熵)来进行样本划分,实质是在样本空间进行块状的划分,主要用来分类,也有做回归,但更多的是作为弱分类器,用在model embedding中

02、随机森林
rf(随进森林),是由许多决策树构成的森林,每个森林中训练的样本是从整体样本中抽样得到,每个节点需要进行划分的特征也是抽样得到,这样子就使得每棵树都具有独特领域的知识,从而有更好的泛化能力;

例如之前的泰坦尼克号生存率的预测,采用随机森林预测乘客生存率

03、梯度提升决策树
gdbt,梯度提升决策树,实际上也是由多棵树构成,和rf不同的是,每棵树训练样本是上一棵树的残差,这体现了梯度的思想,同时最后的结构是用这所有的树进行组合或者投票得出,主要用在推荐、相关性等;

xgboost扩展和改进了gdbt,xgboost算法更快,准确率也相对高一些。在绝大多数的回归和分类问题上,XGBoost的实际表现都是顶尖的。
XGBoost更适用于变量数较少的表格数据,而深度学习则更适用于图像或其他拥有海量变量的数据。

例如公共自行车租借情况预测,采用xgboost完成对测试集中公共自行车租借情况的预测

xgboost与深度学习的比较

相关文章

  • 监督学习简介

    监督学习通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据...

  • 第十三章 聚类(Clustering)

    13.1 聚类简介 聚类是一个非监督学习的算法,监督学习和非监督学习的介绍在第一章:监督学习VS非监督学习 - 简...

  • 机器学习(六):K-means聚类原理及案例分析

    一、算法简介 1、监督学习和非监督学习 监督学习 监督学习是根据已有的数据集,知道输入和输出结果之间的关系。根据这...

  • 【第一周】无监督学习

    1、无监督学习简介 利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。 有监督学习和无监督学习...

  • 机器学习算法之聚类(Clustering)

    1.无监督学习:简介 聚类算法:第一个无监督学习算法(无标签的数据) 什么是无监督学习呢?对比:监督学习问题指的是...

  • 聚类(Clustering)

    1.无监督学习:简介 聚类算法:第一个无监督学习算法(无标签的数据) 什么是无监督学习呢?对比:监督学习问题指的是...

  • 机器学习-吴恩达笔记8(1)之K-means

    Week8-聚类与降维 无监督学习unsupervised learning 无监督学习简介 聚类和降维是无监督学...

  • 增强学习(一)

    一. 增强学习简介 1.1 什么是增强学习? 机器学习的算法可以分为三类:监督学习,非监督学习和增强学习。 增强学...

  • 机器学习中三大学习类别

    简介 在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervise...

  • 全面解析Kmeans聚类(Python)

    一、聚类简介 Clustering (聚类)是常见的unsupervised learning (无监督学习)方法...

网友评论

      本文标题:监督学习简介

      本文链接:https://www.haomeiwen.com/subject/senskxtx.html