美文网首页
决策树的总结

决策树的总结

作者: 在做算法的巨巨 | 来源:发表于2018-11-05 21:18 被阅读0次

决策树的核心思想是分域,
无论是做回归还是分类。

分类方面,决策数的参考变量是 信息增益。
信息熵:数据的无序程度,信息熵越大,数据不确定性越大。H(D)=-\sum_{i=1}^{m}p_i * log(p_i)
信息增益:经验信息熵减去经验条件熵,信息增益越大,说明条件特征越能减小数据的不确定性。gain(D,A)=H(D) - H(D|A)
H(D|A) = \sum_{i=1}^{m}\frac{D_i}{D}H(D_1)
因此,猜想,信息增益可以作为feature selection的一种手段。
决策树中的Id3算法一般用信息增益作为分割判断依据。
信息增益比:信息增益的缺点是特征数据的分布不一,数据多的特征数据增益就会偏大一点,因此,为了减少这些误差,加一个分母,类似与归一化的操作,让数据停留在同一标准下进行比较。
决策树中的C4.5算法采用的便是信息增益比。

gini系数:和信息熵类似的一个变量。1-\sum_{i=1}^{m}p_i
gini系数越大,表示数据不确定性越大。
CART算法采用gini系数进行判断。

每进行一次分隔都会计算一次最优特征,采用递归算法。

回归方面,决策数的参考变量是MSE。
对每个点进行尝试分隔,计算left和right的MSE,结束后,在两侧MSE之和中找出最小的MSE对应的点的位置。左侧取左侧的平均,右侧取右侧的平均,树的层数可以通过设定阈值MSE来实现。迭代算法中知道满足阈值精度停止。这里回归采用了二叉树的思想。

相关文章

  • 决策树算法总结

    目录 一、决策树算法思想 二、决策树学习本质 三、总结 一、决策树(decision tree)算法思想: 决策树...

  • 机器学习系列(三十六)——回归决策树与决策树总结

    本篇主要内容:回归决策树原理、回归树学习曲线、决策树总结 回归决策树原理 回归决策树树是用于回归的决策树模型,回归...

  • 决策树

    本周学了一种非要重要也非常基础的核心分类算法——决策树。下面对决策树算法做一个总结:) 决策树(decision ...

  • 刘润商学院日课总结12.11

    今日总结:决策树 决策树,就是把决策点画出来,以便用这种方式更好的找到自己要用的方案。

  • ID3/C4.5/CART决策树算法推导

    目录 一、ID3决策树 二、C4.5决策树 三、CART决策树 四、总结 信息熵——度量样本集合纯度最常用一种指标...

  • ID3和C4.5决策树算法总结及其ID3Python实现

    ID3和C4.5决策树算法总结及其ID3Python实现 1.决策树的算法流程 决策树的算法流程主要是:1.如果当...

  • 决策树——ID3、C4.5、CART

    本篇开始总结一下以决策树为基础的模型,当然本篇的内容就是决策树了,决策树可以用来分类也可以用来回归,用作分类的应该...

  • 从决策树、GBDT到XGBoost和LightGBM总结

    一、决策树 决策树的构建还是基于我们传统的数据结构与算法的基础上面延伸而来的,下面的思维导图简单的总结了一下决策树...

  • [笔记]决策树

    本文主要介绍了决策树的原理及算法 决策树的工作原理 决策树基本上就是把我们以前的经验总结出来。我给你准备了一个打篮...

  • CSS居中完全指南——构建CSS居中决策树

    CSS居中完全指南——构建CSS居中决策树 本文总结CSS居中,包括水平居中和垂直居中.本文相当于CSS决策树,下...

网友评论

      本文标题:决策树的总结

      本文链接:https://www.haomeiwen.com/subject/dkxagftx.html