美文网首页
data mining-基础算法-分治法:创建决策树

data mining-基础算法-分治法:创建决策树

作者: crishawy | 来源:发表于2018-09-20 21:21 被阅读0次

创建决策树可采用递归的形式。首先,选择一个属性作为根节点,为每个可能的属性组测产生一个分支,从而生成实例数为n的叶子节点。

确定属性节点

采用信息量来选择节点,计算每个属性下的信息量(信息量采用熵定义),单位是bit,依次计算每个属性的信息量。在创建任何初始树之前,计算初始信息量,根据实例的分类情况。接着,计算每个属性的信息增益,从而根据信息增益的大小选择节点作为根节点。

高度分支属性

当一些属性拥有的可能值的数量很大时,从而增加分支,可以得到如下结论:当采用信息增益的方法会倾向于选择拥有较多可能属性值的属性,为了弥补这个缺陷,采用增益率的度量来修正,其考虑了属性分裂数据集后所产生的子节点的数量和规模,忽略了任何有关类别的信息。

image.png

注:这里仅阐述了基本的信息增益算法ID3,在称为C4.5的决策树归纳的一个有用的算法,改进了ID3。

相关文章

  • data mining-基础算法-分治法:创建决策树

    创建决策树可采用递归的形式。首先,选择一个属性作为根节点,为每个可能的属性组测产生一个分支,从而生成实例数为n的叶...

  • data mining-基础算法-简单概率算法

    朴素贝叶斯方法 理解:使用先验概率来进行推演后验概率进而进行预测分类。 注意点: 只有当各个属性独立时,才可以使用...

  • 高级算法设计与分析

    目录 算法基础 算法复杂性 递归与分治 回溯法与分支限界法 贪心算法 动态规划法 NP问题 概率算法 现代优化算法...

  • Divide and Conquer

    算法之 分治法 Divide and Conquer 分治法: 分治法的设计思想是:将一个难以直接解决的大问题,分...

  • 分治法,动态规划及贪心算法区别

    原文:分治法,动态规划及贪心算法区别 1.分治法 分治法(divide-and-conquer):将原问题划分成n...

  • 排序算法之归并排序

    介绍 归并排序,是创建在归并操作上的一种有效的排序算法。该算法是采用分治法的一个非常典型的应用,且各层分治递归可以...

  • [算法导论]归并排序

    时间复杂度 《算法导论》2.3.1 分治法。 归并排序采用了分治法的递归排序。分治法:分解子问题,解决子问题,合并...

  • 归并排序

    1、分治法 归并排序是完全遵循分治策略的排序算法。什么是分治法? 分治法,即将原问题分解为几个规模较小的子问题,递...

  • 归并排序

    排序简介 归并排序,是创建在归并操作上的一种有效的排序算法。算法是采用分治法(Divide and Conquer...

  • 常见算法4、合并(归并)排序 Merge sort

    一、简介 归并排序,是创建在归并操作上的一种有效的排序算法。算法是采用分治法(Divide and Conquer...

网友评论

      本文标题:data mining-基础算法-分治法:创建决策树

      本文链接:https://www.haomeiwen.com/subject/qefonftx.html