美文网首页
decision tree 笔记

decision tree 笔记

作者: 小乙集 | 来源:发表于2016-09-22 14:46 被阅读0次

这是一个基础入门的算法,思想很简单,利用attribute进行树枝节点的分类,从而达到training set的分类。xgboost等算法也是基于decision tree。不过现在行业中已经很少用了。

decision tree 笔记

1. 关于entropy。经常会搞混这个概念。其实就是熵的混乱度。未知的“可能性”。比如抛起一个硬币,得到正面和反面的概率。在抛起硬币前,一切都是未知的,正反概率是一半一半,所以始终不知道到底是什么样的结果。所以这时候entropy是最大的,即为1。另一方面,如果从一堆红球中抽取一个小球,那么结果肯定是红色的小球,这个结果是在抽取前就知道的,所以entropy为0。

entropy=-和(p*log p)

2. 还有overfitting的问题,一般使用方法是剪枝。可以是预剪枝,在从上至下的简历dt的时候,验证crossvalidation,精度是否改变,精度增大则继续划分子节点,否则停止划分。或者是后剪枝,在dt建立完成之后进行剪枝,也是判断节点的crossvalidation,决定是否剪枝。

或者在error达到某个设定threshold的时候就停止。

相关文章

  • 机器学习技法笔记:09 Decision Tree

    Roadmap Decision Tree Hypothesis Decision Tree Algorithm ...

  • decision tree 笔记

    这是一个基础入门的算法,思想很简单,利用attribute进行树枝节点的分类,从而达到training set的分...

  • Nonelinear Model

    Nonelinear Model Decision Tree decision tree is a supervi...

  • 机器学习:Chapter4-5

    Chapter 4: 决策树(decision tree) what is decision tree? 基本流程...

  • Machine Learning Notes-Decision

    什么是 Decision Tree? Decision Tree 可以把 Input 映射到离散的 Labels。...

  • Classification- Decision Tree(1)

    1. Decision Tree: It is similar to the tree structure in ...

  • 决策树、随机森林、GBDT

    概念 决策树(Decision Tree)分为两大类,回归树(Regression Decision Tree)和...

  • Decision tree

    Decision tree(决策树) (注:本文并非原创,但修改了原文中几处代码错误以及部分概念描述的模糊之处,新...

  • Decision Tree

    ①Aggregation Model 回顾上一篇文章讲到的聚合模型,三个臭皮匠顶一个诸葛亮。于是出现了blendi...

  • decision tree

    ID3 C4.5 CART 比较 ID3(以信息增益为准则选择信息增益最大的属性) 缺点 信息增益对==可取值数目...

网友评论

      本文标题:decision tree 笔记

      本文链接:https://www.haomeiwen.com/subject/ltuzettx.html