美文网首页
机器学习之决策树

机器学习之决策树

作者: 长亭远望夜色微凉 | 来源:发表于2019-05-24 16:06 被阅读0次

信息熵:

信息熵描述信息源的不确定程度,信息熵越大、越不确定.

信息熵公式: H(X)=-P_i\log_2P_i  

信息熵公式

例子:

假设中国乒乓球队和巴西乒乓球队历史交手共64次,其中中国获胜63次,那么这次中国巴西比赛结果的信息熵多少?

第一反应,中国队赢球,是一个很确定的事情,信息熵小

中巴比赛结果有两种可能: 胜或负

根据信息熵计算公式: 

1. 共64场比赛, 中国胜63场, 负1场

    H_1 = -63/64*log_263/64    H_2 = -1/64*log_21/64

   H = H_1 + H_2-(63/64*log_263/64+1/64*log_21/64)

H(中巴比赛结果)=-(63/64*log_263/64+1/64*log_21/64)

                                    =-(0.984*log_20.984+0.0156*log_20.0156)

                                    = (0.0233*0.984+ 6.00231*0.0156)

                                      =0.117

2.假设德国丘乓球队和法国乒乓球队比赛,双方历史交手64次,交手胜负为32:32

H(德国法国比赛结果)=-(0.5*log_20.5+0.5*log_20.5)

                                                =(0.5+0.5)=1

1>0.117,所以德国和法国比赛结果和中国巴西之间的比赛结果相比,具有更大不确定性

信息增益率:

如何选择决策树的每个节点:

信息增益率:公式 决策树

ID3算法

H(D|outlook):条件熵,给定outlook条件计算得到熵

g(D,outlook)=H(D)-H(D|outlook)

H(D|outlook=sunny,overcast,rainy)=

    sunny个数/总的个数H(D|outlook=sunny)+

    overcast个数/总的个数* H(D|outlook=overcast)+

    rainy个数/总的个数* H(D|outlook=rainy)

# 在某一特征下, 当前特征值分类所占的个数/当前特征值总数 * 当前特征值的信息熵

# 各个特征值的信息熵相加即为条件熵, 利用公式即得当前条件(特征)的信息增益率

计算每个特征的信息增益率, 值最大的特征即为当前节点, 不断重复计算过程, 直到获取所有的节点(需要将各个特征的值转为离散值)

计算流程

其他算法

其他算法 优缺点

相关文章

  • 机器学习之决策树(Decision Tree)及其Python

    机器学习之决策树(Decision Tree)及其Python代码实现

  • [机器学习]决策树

    决策树 @(技术博客)[机器学习, 决策树, python] 学习决策树首先要搞清楚决策树是什么(what),在弄...

  • 6.machine_learning_Decision_Tree

    1 机器学习决策树 1.1机器学习中的决策树模型 ① 树模型不用做scaling ② 树模型不太需要做离散化 ③ ...

  • 机器学习 | 决策树及若干基础问题

    决策树 1.构造决策树 学习决策树就是学习一系列if/else问题,是我们能够以最快的速度得到正确答案。在机器学习...

  • ID3、C4.5、CART决策树生成算法总结

    简介 决策树模型是最常见的机器学习方法之一,也是入门机器学习必须掌握的知识。决策树模型呈现树形结构,在分类问题中,...

  • 机器学习之决策树

    刚刚在kaggle上练习了决策树的回归训练, 预测房价决策树图示: 决策树通过分类的方法得到样本的预测值, 叶子结...

  • 机器学习之决策树

    决策树是机器学习最基础的算法之一,基于决策树可衍生出AdaBoostTree、随机森林、GBDT等高级算法。本文重...

  • 机器学习之决策树

    决策树是什么? 决策树就是通过层层递进的判断来得出最终的一个答案。就像是二十个问题的游戏,通过对问题的推断分解,逐...

  • 机器学习之决策树

    一、什么是决策树 相关名词 信息熵 信息增益和信息增益率 剪枝、预剪枝和后剪枝 过拟合 根节点和叶节点(关于这些名...

  • 机器学习之决策树

    原文地址 决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中...

网友评论

      本文标题:机器学习之决策树

      本文链接:https://www.haomeiwen.com/subject/rkngzqtx.html