决策树python实现

决策树python实现

作者: simple的课 | 来源:发表于2019-04-14 16:39 被阅读0次

机器学习之决策树（Decision Tree）及其Python
常用机器学习算法
理论-决策树
Python学习——决策树中纯度算法的实现
ID3和C4.5决策树算法总结及其ID3Python实现
决策树算法
决策树【python实现】
决策树python实现
决策树的python实现
[机器学习]决策树

参考书籍：机器学习--周志华 / 数据挖掘导论 / 统计学习方法

参考代码链接：https://blog.csdn.net/weixin_40683253/article/details/81941583#commentsedit

博主还非常nice地给我发了数据集，感谢！

1. 概念

决策树是基于树结构来进行决策的。根结点包含样本全集，叶结点对应于决策结果。其他的每个结点对应于一个属性测试，每个结点包含的样本集合根据属性测试的结果被划分到子节点中。

属性：{色泽，根蒂，敲声，纹理，脐部，触感}

属性值： eg：色泽={青绿，乌黑，浅白}

2. 最优划分属性选择算法

信息熵（information entropy）：D的信息熵： $Ent(D) = - \sum_{k=1}^n p_{k} \log_2 p_{k}$

$p_{k}$ 为当前样本集合D中第 $k$ 类样本所占的比例。

$Ent(D)$ 的值越小，则D的纯度越高。

ID3算法：以信息增益(information gain)为准则来选择划分属性。

属性a对样本集D进行划分所获得的信息增益： $Gain(D, a) = Ent(D) - \sum_{v=1}^V\frac{\vert D^v \vert }{D} Ent(D^v)$

$D^v$ 表示D中所有在属性a上取值为 $a^v$ 的样本。

信息增益越大，使用属性a来进行划分所获得的纯度提升越大。选取信息增益最大的属性作为划分属性。

C4.5算法：以增益率则来选择最优划分属性（先从候选划分属性中找出信息增益高于平均水平的属性，再从中选择增益率最高的）

增益率： $Gainratio(D, a) = \frac{Gain(D, a)}{IV(a)}$

$IV(a) = -\sum_{v=1}^V\frac{\vert D^v \vert }{\vert D \vert }\log_2 \frac{|D^v| }{\vert D \vert }$

CART算法：以基尼指数(来选择划分属性。

基尼值： $Gain(D) = 1-\sum_{k=1}^np_{k}^2$

$Gini index =(D, a) = \sum_{v=1}^V\frac{|D^v| }{|D|} Gini(D^v)$

3. python实现

1. 需要用到的工具import

2. 主函数

3. 数据处理并导入

4. 建立决策树

5. 如果每条数据只包含分类结果，则选择分类结果count最大的输出，这是一种特殊情况

6. 利用信息增益最大的原则选择划分属性

7. step6中计算信息增益的时候需要用到的信息熵

8. 在step6中计算信息增益需要用到的函数。

完整代码：

相关文章

机器学习之决策树（Decision Tree）及其Python
机器学习之决策树（Decision Tree）及其Python代码实现
常用机器学习算法
决策树 - 参考：decision Tree（Python 实现）http://blog.csdn.net/dre...
理论-决策树
ID3算法Building Decision Trees in Python如何实现并应用决策树算法？
Python学习——决策树中纯度算法的实现
决策树决策树算法是机器学习中的一个基础算法，该算法有着诸多的优点。在python中实现决策树，现阶段都已经集成中...
ID3和C4.5决策树算法总结及其ID3Python实现
ID3和C4.5决策树算法总结及其ID3Python实现 1.决策树的算法流程决策树的算法流程主要是：1.如果当...
决策树算法
运行平台：Windows Python版本：Python3.x IDE：pycharm 一、决策树决策树是什么？...
决策树【python实现】
0.周董歌词中的决策树为什麼别人在那看漫画我却在学画画对著钢琴说话别人在玩游戏我却靠在墙壁背我的ABC拿...
决策树python实现
参考书籍：机器学习--周志华 / 数据挖掘导论 / 统计学习方法参考代码链接：https://blog.csdn...
决策树的python实现
之前看到使用python实现决策树的文章，找了一批数据样本来实现一遍。以下为依葫芦画瓢的复盘实现代码实现数据集...
[机器学习]决策树
决策树 @(技术博客)[机器学习, 决策树, python] 学习决策树首先要搞清楚决策树是什么（what），在弄...

网友评论

本文标题：决策树python实现

本文链接：https://www.haomeiwen.com/subject/jufswqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|决策树python实现|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！