美文网首页
算法的小白理解(转)

算法的小白理解(转)

作者: 美琦miki视觉笔记 | 来源:发表于2020-04-05 20:05 被阅读0次

    决策树:依靠某种指标,进行树的分裂达到分类/回归的目的,总是希望纯度越高越好。量化纯度的方法有信息增益(ID3)、信息增益率(C4.5)、基尼系数(CART)等,其他细节如剪枝、过拟合、优缺点、并行情况。。

    首先说下决策树
    决策树是啥?
    举个例子,有一堆人,我让你分出男女,你依靠头发长短将人群分为两拨,长发的为“女”,短发为“男”,你是不是依靠一个指标“头发长短”将人群进行了划分,你就形成了一个简单的决策树,官方细节版本自行baidu或google

    划分的依据是啥?
    这个时候,你肯定问,为什么用“头发长短”划分啊,我可不可以用“穿的鞋子是否是高跟鞋”,“有没有喉结”等等这些来划分啊,Of course!那么肯定就需要判断了,那就是哪一种分类效果好,我就选哪一种啊。

    分类效果如何评价量化呢?
    怎么判断“头发长短”或者“是否有喉结”…是最好的划分方式,效果怎么量化。直观来说,如果根据某个标准分裂人群后,纯度越高效果越好,比如说你分为两群,“女”那一群都是女的,“男”那一群全是男的,这个效果是最好的,但事实不可能那么巧合,所以越接近这种情况,我们认为效果越好。于是量化的方式有很多,信息增益(ID3)、信息增益率(C4.5)、基尼系数(CART)等等,来用来量化纯度

    其他细节如剪枝、过拟合、优缺点、并行情况等自己去查吧。决策树的灵魂就已经有了,依靠某种指标进行树的分裂达到分类/回归的目的(上面的例子是分类),总是希望纯度越高越好。

    相关文章

      网友评论

          本文标题:算法的小白理解(转)

          本文链接:https://www.haomeiwen.com/subject/rbspphtx.html