美文网首页技术心得
决策树核心总结

决策树核心总结

作者: Eric_i33 | 来源:发表于2018-05-08 21:56 被阅读1次

网上关于ID3、C4.5、CART的讲解已极为丰富,本文只想聚焦决策树系算法的核心:变量划分,做一些总结,加深对算法核心的认识。

1、决策树的核心

决策树的核心

2、from 自信息 to 信息熵 to 交叉熵 to KL散度

从自信息到信息熵、交叉熵、KL散度的推导

3、离散特征信息增益率计算

给定一个简单的数据集 计算过程

4、连续特征信息增益计算

给定一个简单的数据集

5、如果标记值为连续变量:CART

CART 对于有多个水平的属性A, 分别计算每一种分界后因变量的方差和 选择方差和最小的分界策略作为属性A的最优二分方案 遍历所有属性, 取方差和最小的属性作为分割属性

6、针对特征为离散和连续,标记为离散的过程总结

(1)、针对连续特征,按数值大小进行排序,并在标记发生改变的地方进行分裂,计算信息增益;依次针对每一种分裂情形,计算信息增益,最终选择信息增益最大的分裂情形作为这个特征的最佳分裂点;计算它的信息增益率;

(2)、针对离散特征,计算它的信息增益率;

(3)、在特征的信息增益率间进行横向比较,选择信息增益率最大的特征作为当下最优分裂属性,进行分裂,划分数据子集;

(4)、依次递归重复步骤(1)~(3),直到叶子节点只剩一个水平值(过拟合)或达到停止要求(最大深度阈值、叶子节点最小样本阈值等等,如果是 XGBoost 会有更多需要调参)

相关文章

  • 决策树

    本周学了一种非要重要也非常基础的核心分类算法——决策树。下面对决策树算法做一个总结:) 决策树(decision ...

  • 决策树核心总结

    网上关于ID3、C4.5、CART的讲解已极为丰富,本文只想聚焦决策树系算法的核心:变量划分,做一些总结,加深对算...

  • 决策树算法总结

    目录 一、决策树算法思想 二、决策树学习本质 三、总结 一、决策树(decision tree)算法思想: 决策树...

  • 一句话总结随机森林

    一句话总结随机森林 核心:用有放回采样的样本训练多棵决策树,训练决策树的每个节点是只用了无放回抽样的部分特征,预测...

  • 机器学习第六周笔记 决策树,组合提升算法,bagging和ada

    决策树decision tree 什么是决策树输入:学习集输出:分类觃则(决策树) 算法的核心问题 该按什么...

  • 机器学习系列(三十六)——回归决策树与决策树总结

    本篇主要内容:回归决策树原理、回归树学习曲线、决策树总结 回归决策树原理 回归决策树树是用于回归的决策树模型,回归...

  • 数据科学(机器学习: 决策树(ID3算法 ))

    决策树构建 ID3算法 ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。 从根结点...

  • 决策树: 特征选择之寻找最优划分

    前言决策树算法的三个步骤:特征选择、决策树生成、决策树剪枝。其中特征选择要解决的核心问题就是:每个节点在哪个维度上...

  • 决策树Decision Tree

    决策树: ID3:其核心是在决策树的各级节点上,实用信息增益(information gain)作为属性的选择标准...

  • ID3/C4.5/CART决策树算法推导

    目录 一、ID3决策树 二、C4.5决策树 三、CART决策树 四、总结 信息熵——度量样本集合纯度最常用一种指标...

网友评论

    本文标题:决策树核心总结

    本文链接:https://www.haomeiwen.com/subject/uixgrftx.html