GBDT模型

GBDT模型

作者: 棒棒唐_KT | 来源:发表于2017-07-22 21:04 被阅读792次

GBDT模型
XGBoost和LightGBM对GBDT的改进
GBDT模型介绍
机器学习数据挖掘常见面试题
adaboost和xgboost的区别和联系
ctr 模型比较
【金融风控】风险模型评价指标
基于树模型的集成算法---GBDT
模型效果上限预估、分类模型Bad Case分析方法
GBDT模型本质理解

模型的基本原理不在赘述，仅结合scikit-learn中gbdt的实现，理清思路。

1 流程图

gbdt实现流程图.png

1.1 总体迭代过程

_fit_stage.png

2 损失函数

2.1 GradientBoostingRegressor的损失函数

sklearn中实现了四种目标函数：LeastSquaresError，LeastAbsoluteError，HuberLossFunction，QuantileLossFunction。本人只使用过LeastSquaresError，LeastAbsoluteError这两种，因此仅对这两种目标函数展开理解。

LeastSquaresError
最小均方误差函数，形式为：
均方误差损失函数.png
其对应的负梯度为：
均方误差损失函数-负梯度.png
代码中的体现为：

image.png

LeastAbsoluteError
最小绝对值误差函数：形式为：

最小绝对值误差损失函数.png

image.png

2.2 GradientBoostingClassifier的损失函数

sklearn中实现了两种目标函数：Deviance（二分类问题BinomialDeviance和多分类问题MultinomialDeviance），ExponentialLoss。

BinomialDeviance损失函数为：

image.png

负梯度

image.png

代码中的体现

binomialDeviance.png

ExponentialLoss 损失函数为：

ExponentialLoss 损失函数.png

负梯度

image.png

代码中的体现

image.png

实际上以上两种损失函数都是偏差最小化损失函数，其一般化公式为：

image.png

值得注意的是，在Friedman的论文Greedy Function Approximation A Gradient Boosting Machine 中，描述的目标函数为

negative binomial log-likelihood-Friedman损失函数.png
该目标函数对应的标签为y = {-1,1} ，而sklearn中对应的标签为y = {0,1}, 两者是等价的：

image.png

2.3 单棵回归树

在总体迭代过程一节我们已经看到，每次迭代都会建立一个回归树去拟合负梯度向量，与建树相关的点有：

损失函数
均方差损失函数
节点分裂原则：

节点分裂原则.png

通常使用的是friedman_mse原则，公式为Greedy Function Approximation: A Gradient Boosting Machine论文中的(35)式:

friedman_mse.png
叶子节点的值
叶子节点的值为分到该叶子节点的所有样本对应的输出yi的平均值。

Refs

Generalized Boosted Models: A guide to the gbm package
Greedy Function Approximation: A Gradient Boosting Machine
Additive Logistic Regression a Statistical View of Boosting.pdf

相关文章

GBDT模型
模型的基本原理不在赘述，仅结合scikit-learn中gbdt的实现，理清思路。 1 流程图 1.1 总体迭代过...
XGBoost和LightGBM对GBDT的改进
首先需要了解什么是GBDT。简单来讲，GBDT就是将多个相关性很高的基分类器结合起来的模型。模型中每次新增的基...
GBDT模型介绍
GBDT 调参变量重要性衡量
机器学习数据挖掘常见面试题
模型推导：LR SVM GBDT EM RF、GBDT的区别决策树处理连续值的方法特征选择的方法过拟合的解决...
adaboost和xgboost的区别和联系
机器学习算法中GBDT与Adaboost的区别与联系是什么？ Adaboost Adaboost是模型为加法模型，...
ctr 模型比较
LR LR是线性分类模型，要求输入线性独立特征。 GBDT GBDT是一种迭代的决策树算法，它由多棵决策树组成，所...
【金融风控】风险模型评价指标
一、 ROC曲线和AUC值在逻辑回归、随机森林、GBDT、XGBoost这些模型中，模型训练完成之后，每个样本都...
基于树模型的集成算法---GBDT
一、模型介绍 GBDT 的全称是 Gradient Boosting Decision Tree，梯度提升决策树。...
模型效果上限预估、分类模型Bad Case分析方法
模型效果上限预估、分类模型Bad Case分析方法给定训练和测试数据集，训练某个二分类模型（如，GBDT算法），...
GBDT模型本质理解
GBDT，英文全称：Gradient Boosting Decision Tree，属于Ensemble Lear...

网友评论

本文标题：GBDT模型

本文链接：https://www.haomeiwen.com/subject/lbgqkxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|GBDT模型|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！