美文网首页
机器学习—信息增益

机器学习—信息增益

作者: hwang_zhic | 来源:发表于2019-01-20 21:38 被阅读0次

举例说明:如果有8位同学,男生3位,女生5位。 如果用头发,和声音判断男女,那么头发长判断完,在判断声音细好呢?还是用声音细先判断,在用头发长判断好呢?这个头发,声音就是“熵”,那么两种判断方法就是两种“信息增益”,需要计算它,比较哪个信息增益的值更大,意味着用这个属性来进行划分所获得的“纯度提升”越大,方知哪种更好。

首先计算未分类前的熵 :熵(总)=-3/8*log2(3/8)-5/8*log2(5/8)=0.9544 

先按A头发分类,分类后的结果为:长头发中有1男3女。短头发中有2男2女。

熵(A长发)=-1/4*log2(1/4)-3/4*log2(3/4)=0.8113

熵(A短发)=-2/4*log2(2/4)-2/4*log2(2/4)=1

熵(A)=4/8*0.8113+4/8*1=0.9057

信息增益(同学A)=熵(总)-熵(A)=0.9544-0.9057=0.0487

再按B声音特征来分,分类后的结果为:声音粗中有3男3女。声音细中有0男2女。

熵(B声音粗)=-3/6*log2(3/6)-3/6*log2(3/6)=1

熵(B声音粗)=-2/2*log2(2/2)=0

熵(B)=6/8*1+2/8*0=0.75

信息增益(B)=熵(总)-熵(A)=0.9544-0.75=0.2087

按B的方法,先按声音特征分类,信息增益更大,区分样本的能力更强,更具有代表性。

作者:andyham

链接:https://www.jianshu.com/p/3f3caebb7e7a

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

相关文章

  • 机器学习—信息增益

    举例说明:如果有8位同学,男生3位,女生5位。 如果用头发,和声音判断男女,那么头发长判断完,在判断声音细好呢?还...

  • 《机器学习实战》决策树构建学习

    概要记录 Decision Tree基本学习,学习自《机器学习实战》P32 - P42 (基于信息增益的决策树构建...

  • 信息增益与信息增益比

    首先,我们说熵,熵是随机变量不确定性的度量 那么,为什么用这个公式来定义熵,我们看下熵随概率的变化曲线便会一目了然...

  • [Mark]信息增益、信息增益比、CART

  • 机器学习算法——决策树3(信息增益和ID3算法)

    信息增益 信息增益 算法思想 信息增益的算法过程为: 出入:训练数据集D和特征A 输出:特征A对训练数据集D的信息...

  • 信息熵、条件熵、信息增益、信息增益率

    一、信息熵 1. 信息熵提出背景 我们生活在一个信息爆炸的时代,从信息学的角度来说,人类进步的本质就是不断的打...

  • 李航-第5章决策树

    决策树的学习算法包特征选择、决策树的生成与决策树的剪枝过程。决策树学习应用信息增益准则选择特征。信息增益大的特征具...

  • decision tree

    ID3 C4.5 CART 比较 ID3(以信息增益为准则选择信息增益最大的属性) 缺点 信息增益对==可取值数目...

  • 信息增益法

    信息熵 在文本分类中,假设文本共k类,每类出现的概率是: 其中每个类别的信息熵计算公式: 信息熵代表了不不确定性,...

  • 信息增益,熵

    概念:在信息增益中,衡量标准是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。对一个特征而言,系统...

网友评论

      本文标题:机器学习—信息增益

      本文链接:https://www.haomeiwen.com/subject/wcihdqtx.html