美文网首页
第八章 数据决策分析算法——基于C4.5算法的决策树

第八章 数据决策分析算法——基于C4.5算法的决策树

作者: 文颜 | 来源:发表于2019-11-03 10:19 被阅读0次

8.2 基于C4.5算法的决策树

C4.5是J.Ross Quinlan基于ID3算法改进后得到的另一个分类决策树算法。C4.5算法继承了ID3算法的优点,且改进后的算法产生的分类规则易于理解,准确率高。同时,该算法也存在一些缺点,如算法效率低,只适合于能驻留于内存的数据集。

改进:

1、用信息增益率来选择属性,客服了ID3算法选择属性时偏向选择取值多的属性的不足。

2、在决策树构造过程中进行剪枝,不考虑某些具有很少元素结点。

3、能够完成对连续属性的离散化处理。

4、能够对不完整数据进行处理。

信息增益率:

V表示属性集合A中的一个属性的全部取值;

1、计算出样本集合D的信息熵。

2、对属性集A中的每个属性分别计算信息熵。

3、根据步骤2中计算出的数据,计算选择第一个根结点所依赖的信息增益值Gain(V)。

4、计算分裂信息度量H(V)。

5、利用公式IGR(V)=Gain(V)\div H(V)计算信息增益率。

相关文章

  • 第八章 数据决策分析算法——基于C4.5算法的决策树

    8.2 基于C4.5算法的决策树 C4.5是J.Ross Quinlan基于ID3算法改进后得到的另一个分类决策树...

  • day10-决策树

    今天学了决策树的基本知识。 基于信息论的决策树算法有:ID3, CART, C4.5等算法。 ID3 算法是根...

  • 2019-04-26

    决策树 离散型数据ID3 连续型数据C4.5 分类与回归树算法(CART) CART算法就是将决策树中用于判断特征...

  • 机器学习之决策树算法

    前言:决策树模型是一类算法的集合,在数据挖掘十大算法中,具体的决策树算法占有两席位置,即C4.5和CART算法 下...

  • c4.5

    C4.5是机器学习算法中的另一个分类决策树算法,它是基于ID3算法进行改进后的一种重要算法,相比于ID3算法,改进...

  • 分类决策树算法

    C4.5是机器学习算法中的另一个分类决策树算法,它是基于ID3算法进行改进后的一种重要算法,相比于ID3算法,改进...

  • 05 决策树 - 生成算法 ID3、C4.5、CART

    ID3 提出了初步的决策树算法;C4.5 提出了完整的决策树算法;CART (Classification And...

  • 分类(1):决策树与模型评估

    一、如何建立决策树 1、Hunt算法 Hunt算法是许多决策树算法的基础,包括ID3、C4.5、CART。Hunt...

  • 从cart决策树到XGBoost

    一. cart决策树简述 我们知道决策树算法有ID3、C4.5和cart三种,ID3和C4.5是基于信息增益和信息...

  • 数挖——基本分类

    构造决策树有多种算法:1、Hunt算法 (决策树归纳算法框架)2、CART3、ID3, C4.5 (重点)4、SL...

网友评论

      本文标题:第八章 数据决策分析算法——基于C4.5算法的决策树

      本文链接:https://www.haomeiwen.com/subject/ytykbctx.html