美文网首页
算法的小白理解(转)

算法的小白理解(转)

作者: 美琦miki视觉笔记 | 来源:发表于2020-04-05 20:05 被阅读0次

决策树:依靠某种指标,进行树的分裂达到分类/回归的目的,总是希望纯度越高越好。量化纯度的方法有信息增益(ID3)、信息增益率(C4.5)、基尼系数(CART)等,其他细节如剪枝、过拟合、优缺点、并行情况。。

首先说下决策树
决策树是啥?
举个例子,有一堆人,我让你分出男女,你依靠头发长短将人群分为两拨,长发的为“女”,短发为“男”,你是不是依靠一个指标“头发长短”将人群进行了划分,你就形成了一个简单的决策树,官方细节版本自行baidu或google

划分的依据是啥?
这个时候,你肯定问,为什么用“头发长短”划分啊,我可不可以用“穿的鞋子是否是高跟鞋”,“有没有喉结”等等这些来划分啊,Of course!那么肯定就需要判断了,那就是哪一种分类效果好,我就选哪一种啊。

分类效果如何评价量化呢?
怎么判断“头发长短”或者“是否有喉结”…是最好的划分方式,效果怎么量化。直观来说,如果根据某个标准分裂人群后,纯度越高效果越好,比如说你分为两群,“女”那一群都是女的,“男”那一群全是男的,这个效果是最好的,但事实不可能那么巧合,所以越接近这种情况,我们认为效果越好。于是量化的方式有很多,信息增益(ID3)、信息增益率(C4.5)、基尼系数(CART)等等,来用来量化纯度

其他细节如剪枝、过拟合、优缺点、并行情况等自己去查吧。决策树的灵魂就已经有了,依靠某种指标进行树的分裂达到分类/回归的目的(上面的例子是分类),总是希望纯度越高越好。

相关文章

  • 算法的小白理解(转)

    决策树:依靠某种指标,进行树的分裂达到分类/回归的目的,总是希望纯度越高越好。量化纯度的方法有信息增益(ID3)、...

  • LRU算法理解(转)

    问题:某虚拟存储系统采用页式内存管理,使用LRU页面替换算法, 考虑下面的页面访问地址流,1 8 1 7 8 2 ...

  • 1.机器学习算法快速选择

    机器学习算法辣么多,对于小白的我,剪不断理还乱,特整理一些帮助我快速理解的图片 机器学习算法细分 数据分析生活常见...

  • 小白带你学---贪心算法

    微信公众号:小白算法关注可了解更多算法,并能领取免费资料。问题或建议,请公众号留言;小白算法,简单白话算法,每个人...

  • 排序算法

    微信公众号:小白算法关注可了解更多算法,并能领取免费资料。问题或建议,请公众号留言;小白算法,简单白话算法,每个人...

  • 排序算法详解与python实现

    Note:写后感:理解算法思想很重要!理解算法思想很重要!理解算法思想很重要!之后尝试自己独立码代码对算法的理解更...

  • 转--分代回收算法的通俗理解

    jvm 分代回收算法通俗理解 jvm区域总体分两类,heap区和非heap区。heap区又分:Eden Space...

  • 小白算法_楔子

    前言 笔者属于算法小白一枚,本系列文章属于算法的学习笔记,也希望能给算法小小白起到些许的指引作用。如果有算法大佬不...

  • 小白算法_(1)

    前言 笔者属于算法小白一枚,本系列文章属于算法的学习笔记,也希望能给算法小小白起到些许的指引作用。如果有算法大佬不...

  • 小白算法_(2)

    前言 笔者属于算法小白一枚,本系列文章属于算法的学习笔记,也希望能给算法小小白起到些许的指引作用。如果有算法大佬不...

网友评论

      本文标题:算法的小白理解(转)

      本文链接:https://www.haomeiwen.com/subject/rbspphtx.html