美文网首页
决策树-离散数据学习

决策树-离散数据学习

作者: crishawy | 来源:发表于2018-10-02 22:04 被阅读0次

决策树的构建算法过程:

image.png

一般地对于步骤8选取最优划分属性规则不同,将决策树分为ID3算法、C4.5、CART算法

ID3算法

1.信息熵

image.png
2.信息增益
image.png
3.划分规则
每次选择信息增益最大的构建决策树。
4.决策树示例
image.png

C4.5算法

利用最大增益率构建决策树
1.信息增益率

image.png

CART算法

利用基尼指数(反映属性的纯度)最小的属性作为划分属性


image.png

剪枝处理

image.png
剪枝处理主要分为预剪枝和后剪枝。
1.预剪枝
对于决策树从上往下评价每个节点,将每个节点的分支用类别标记为训练样例数最多的类别,然后计算剪枝前和剪枝后的精度,如果精度有所提高,则进行剪枝,否则不进行剪枝。
image.png
image.png
2.后剪枝
对于决策树从下往上评价每个节点,将每个节点的分支用类别标记为训练样例数最多的类别,然后计算剪枝前和剪枝后的精度,如果精度有所提高,则进行剪枝,否则不进行剪枝。
image.png

相关文章

  • 决策树-离散数据学习

    决策树的构建算法过程: 一般地对于步骤8选取最优划分属性规则不同,将决策树分为ID3算法、C4.5、CART算法 ...

  • 【机器学习实战】回归决策树

    根据处理数据类型的不同,决策树分为两类:分类决策树与回归决策树。前者可用于处理离散型数据,后者可用于处理连续型数据...

  • 决策树学习及ID3算法

    决策树学习 决策树学习是应用最广的归纳推理算法之一,它是一种逼近离散值函数的方法,对噪声数据又很好地健壮性且能够学...

  • 6.machine_learning_Decision_Tree

    1 机器学习决策树 1.1机器学习中的决策树模型 ① 树模型不用做scaling ② 树模型不太需要做离散化 ③ ...

  • 2019-04-26

    决策树 离散型数据ID3 连续型数据C4.5 分类与回归树算法(CART) CART算法就是将决策树中用于判断特征...

  • 决策树(二)构建数据集

    1.决策树构建的一般流程 收集数据:任何你能收集数据的方法准备数据: 决策树的算法只适用于标称型数据(可理解为离散...

  • 决策树分类|python

    什么叫做决策树? 决策树是一种经常用于对离散变量和连续变量进行分类的监督学习算法。决策树是具有枝的树,其中每个分支...

  • 学习使用Microsoft决策树创建 OLAP 数据挖掘模型

    微软决策树-挖掘模型建立及应用;学习使用Microsoft决策树创建OLAP数据挖掘模型;深入理解决策树分类的数据...

  • 机器学习决策树算法学习笔记

    基本概念 决策树是分类算法。 数据类型:数值型和标称型。因为构造算法只适用于标称型,所以数值型数据必须离散化。 工...

  • 01-16

    今天看的是算法部分,首先就是C4.5决策树算法,能够对离散型信息数据进行操作,同时补充有属性缺失的相关数据,在决策...

网友评论

      本文标题:决策树-离散数据学习

      本文链接:https://www.haomeiwen.com/subject/revaoftx.html