美文网首页机器学习
聊一聊提升树这个概念

聊一聊提升树这个概念

作者: 只为此心无垠 | 来源:发表于2018-04-16 15:13 被阅读12次

一、概览

首先强调一点,先有提升树模型(总体概念),然后针对不同情况和不同损失函数,提出各自提升树,包含残差提升树,梯度提升树等


这两种树的差别,一是残差和梯度,二是节点分裂根据不一样,残差提升树是根据gini指数,梯度提升树是根据目标函数衍化的

二、提升树概念

提升树(Boosting Decision Tree) = Boosting + Decision Tree。
提升方法实际采用加法模型(即基函数的线性组合)和前向分布算法。
以基函数的提升方法称为提升树。
对分类问题决策树是二叉分类树,对回归问题决策树是二叉回归树

提升树公式


提升树公式

三、基于平方误差的回归提升树(基于残差的提升树)

最原始,最开始提出的提升树,就是基于平方误差的回归提升树,也可以叫基于残差的提升树



image.png

四、梯度提升(基于梯度的提升树)

当损失函数是平方损失和指数损失函数时,每一步优化很自然简单。但对一般损失函数而言,往往每一步优化并不如意。针对这个问题,又提出了梯度提升算法。

他的步骤是:

  • 1、用前向分步算法拟合加法模型。
  • 2、在每个阶段,引入一个新的回归树h,弥补现有模型的‘残差。
  • 3、‘残差’是由负梯度确定的。
  • 4、对于任何损失函数,都可以推导出梯度提升算法。
  • 5、绝对损失和Huber损失,比平方损失,对于异常值更稳健。

核心就是利用损失函数的负梯度在当前模型的值作为回归问题提升树的残差近似值。


image.png

五、残差 vs 梯度

  • 基于平方损失的提升树,受异常点影响大


  • 基于huber损失的提升树,可以减少异常点对整体的影响


  • 因此,负梯度比残差,减少异常点的影响


  • 总结


截图来源于A Gentle Introduction to Gradient Boosting

六、题外话:LR与GBDT

LR是利用梯度更新参数
GBDT是利用梯度更新函数值


截图来源于GBDT算法原理与系统设计简介

参考
1.《统计学习方法》
2、A Gentle Introduction to Gradient Boosting
3、GBDT算法原理与系统设计简介

相关文章

  • 聊一聊提升树这个概念

    一、概览 首先强调一点,先有提升树模型(总体概念),然后针对不同情况和不同损失函数,提出各自提升树,包含残差提升树...

  • 聊一聊and这个小词

    昨天,知新共学外刊群里有一位小伙伴分享了一个小知识点,关于and的用法: 我仔仔细细地看完了他发的几张图,受益匪浅...

  • 聊一聊B+树

    标签: 图解B+树 | B+树代码|mysql 聚集索引|mysql B+树索引| 前言   虽然B+是B-演化过...

  • 我们每个人都在重复自己的过去,一遍又一遍,至死方休

    今天这篇文章我们来聊一聊“重复”这个概念! 重复是一个对我们每个人来说都极其重要的概念,下面我就说说我对这个概念目...

  • 今天聊一聊“钱”这个东西!

    一直有想写写关于钱的话题的想法,钱到底是什么东西?钱的本质是什么?一直想探根溯源,我觉得钱的本质能说明一切问题,关...

  • 聊一聊这个专辑的诞生

    我对这个专辑的定位是以原创写作记录我的2021。不管是以朗读的形式在喜马拉雅出现(我的音色还不错),还是以码字的形...

  • 聊一聊这个闲适的假期

    读到契诃夫的一句话: 愿您一切都好,主要的是,要高高兴兴过日子,不要太费脑子去探究生活,大概这生活实际上要简单得多...

  • 等你归来

    我做的最错一件事, 就是和你不停地聊啊聊, 我以为能聊来春风, 也就能化成春雨, 于是不停地聊啊聊, 聊来一树树花...

  • 石头闲话:资产配置中的常见问题

    今天我们在聊一聊资产配置,为什么想聊这个话题呢?其实主要是石头在春节期间发现身边的很多人对这个概念非常模糊。这边我...

  • 聊一聊

    就是这样,喜欢自我欺骗,明知道,真心想你,或者有事的人,会打电话给你。却还是忍不住的用微信,看一个人的消息和动态,...

网友评论

    本文标题:聊一聊提升树这个概念

    本文链接:https://www.haomeiwen.com/subject/wihekftx.html