美文网首页
机器学习实战——决策树

机器学习实战——决策树

作者: 小二金刚 | 来源:发表于2016-08-22 12:38 被阅读76次

【主要内容】

  • 决策树简介
  • 数据集中度量一致性
  • 使用递归构造决策树
  • 使用Matplotlib绘制树

【数据集度量】

  • 信息增益
    • 克劳德·香农:信息论之父
    • 熵:信息的期望值
    • 信息:l(x_i) = -logp(x_i)
    • 参考材料
      • 《信息论》香农
      • 《财富公式》威廉·庞德斯通
  • 计算数据集的熵——DONE

【划分数据集】

  • 对每一个特征划分数据集,度量划分数据集熵
  • 计算信息增益
    • g(D|A) = H(D) - H(D|A)
    • H(D|A) = sum { |D1|/|D| * H(D_1), |D1|/|D| * H(D_1) ... |Dn|/|D| * H(D_n) }
  • 选择g(D|A)最大的A
  • 划分splitData

【构建决策树】

  • 中止条件:
    • dataSet中,只有一类数据,返回该类(作为叶子);
    • dataSet中只有一种特征,返回主要类(作为叶子)
  • 找到最优特征,(通过遍历所有特征,计算并寻求最大增益熵)
  • 找到最优特征对应的feature label,生成一个root节点,设置feature label为节点标签
  • 遍历最优特征的所有特征值,对每个特征值,抽取数据集合
  • 对每一个数据子集合递归生成一个决策树,挂在当前树下
  • 返回当前tree

【绘制tree】

  • DONE
Paste_Image.png

【剪枝】chapter 9

相关文章

  • python决策树(二叉树、树)的可视化

    问题描述 在我学习机器学习实战-决策树部分,欲可视化决策树结构。最终可视化结果: 解决方案 决策树由嵌套字典组成,...

  • 机器学习实战Py3.x填坑记—决策树

    在输入完程序清单3-5之后运行命令: 遇到问题搜索如下参考:[机器学习&数据挖掘]机器学习实战决策树plotTre...

  • 2018文章集合

    2018年公众号文章集合,过年在家系统学习下。 机器学习实战 该系列讲解了经典机器学习算法的原理(KNN,决策树,...

  • 《机器学习实战》决策树构建学习

    概要记录 Decision Tree基本学习,学习自《机器学习实战》P32 - P42 (基于信息增益的决策树构建...

  • 【机器学习】决策树(构造篇)

    下一篇为:【机器学习】决策树(Matplotlib可视化+项目实战) 最经常使用的机器学习算法k近邻法最大缺点是无...

  • 机器学习实战教程(三):决策树实战篇(a)

    一、前言 上篇文章机器学习实战教程(二):决策树基础篇[https://www.mlxs.top/portal.p...

  • 《机器学习实战》

    有道笔记原文 机器学习实战 Github代码 第一章 机器学习基础 2007年选出的十大数据挖掘算法C4.5决策树...

  • Python pickle模块踩坑

    跟着机器学习实战写代码,决策树这里有一段是保存决策树,使用pickle模块保存,原书是基于2.7的,在3.6上有坑...

  • 机器学习实战-决策树

    1、背景 以上就是之前见过的树状模型,但这里它代表着决策树直观的表达形式。其特殊意义在于,没个叶节点,代表着要划分...

  • 【机器学习实战】决策树

    算法思路 在构造决策树时,第一个需要解决的问题就是,如何确定出哪个特征在划分数据分类是起决定性作用,或者说使用哪个...

网友评论

      本文标题:机器学习实战——决策树

      本文链接:https://www.haomeiwen.com/subject/oxtgsttx.html