XGBoost

XGBoost

作者: Diamond1995 | 来源:发表于2019-04-10 10:21 被阅读0次

day01-集成决策树模型
xgboost安装过程与使用
11 集成学习 - XGBoost案例 - 波士顿房价进行预测
GBDT进化->XGBoost & LightGBM简记
深入理解XGBoost
How to install xgboost in ubuntu
秋招面经
Xgboost原理与Sklearn参数详解
spark xgboost损失函数和评价函数的修改
集成学习之Boosting-xgboost

1.XGBoost算法原理

XGBoost是GDBT算法的应用，GDBT是根据损失函数负梯度来进行拟合每一个弱学习器，然后运用加法模型，将每个弱学习器的结果以加权累加的形式输入到现有的模型中。

而XGBoost也是用的是CART树作为弱学习器，但是它不是根据gini或者均方误差来进行特征选择，而是重新定义了树的特征选择计算的损失函数，根据一阶函数和二阶函数的和最小来进行特征选择。并且在特征选择的时候添加了正则化，剪枝，约束了节点。

2.损失函数

2.1算法的模型：一个算法有其组成的模型，XGBoost就是用若干个决策树组成的。

但是目前树的参数未知，特征选择未知，节点输出结果未知，需要根据损失函数最小，来求解这些参数，而得到最优的树，进而组成最优的模型。

2.2损失函数：这里面添加了正则项，这样可以在寻找最佳模型参数的同时进行剪枝。

现在对训练误差和正则项的具体表达式表示都不知道。

2.3最小化损失函数，根据数据集来训练模型，得到最佳参数。

模型的参数就树的结构，但是一次同时训练n棵树得到其的参数不太现实，我们采用加法模型，一次训练一颗树，令每棵树都让损失函数最小即可。

例如：训练第t棵树，那么t-1棵树的损失函数是确定的。

第i棵树的模型

第i棵树的损失函数：

用泰勒展开式展开损失函数：

泰勒展开式后的损失函数

损失函数的一阶导数，二阶导数。

把里面确定的值（常量去掉）

xgboost的正则项为：

为什么这样形式：简单，有效。

带入损失函数中得：

又 f（Xi）是决策树得结构，决策树得模型为：

用cart树模型替换掉，跟新损失函数:

最终得到：

对叶子节点上的得分求偏导，得各个叶子节点得最佳值wj，求得最佳损失函数为

这个表明可以用训练集的一阶，二阶导数的和来进行特征选择。

5.对缺失值处理

通常情况下，我们人为在处理缺失值的时候大多会选用中位数、均值或是二者的融合来对数值型特征进行填补，使用出现次数最多的类别来填补缺失的类别特征。

但是xgboost模型可以处理缺失值，或者说可以允许缺失值的存在。

：缺失值的处理将其看与稀疏矩阵的处理看作一样。在寻找split point的时候，不会对该特征为missing的样本进行遍历统计，只对该列特征值为non-missing的样本上对应的特征值进行遍历，通过这个技巧来减少了为稀疏离散特征寻找split point的时间开销。在逻辑实现上，为了保证完备性，会分别处理将missing该特征值的样本分配到左叶子结点和右叶子结点的两种情形，计算增益后选择增益大的方向进行分裂即可。可以为缺失值或者指定的值指定分支的默认方向，这能大大提升算法的效率。如果在训练中没有缺失值而在预测中出现缺失，那么会自动将缺失值的划分方向放到右子树。

伪代码：

：

6.优缺点

优点：

1.可以并行，速度快，因为用到的是一阶，二阶导数。

2.在特征选择时就进行了正则化约束。

3.能够自动处理缺失值。

8.sklearn参数

相关文章

day01-集成决策树模型
1、xgboost原理1.1 xgboost原始论文1.2 xgboost原始ppt介绍1.3 xgboost基础...
xgboost安装过程与使用
一、xgboost安装 1.pip install xgboost 进入PyPI页面，搜索xgboost，但是发现...
11 集成学习 - XGBoost案例 - 波士顿房价进行预测
08 集成学习 - XGBoost概述09 集成学习 - XGBoost公式推导10 集成学习 - XGBoost...
GBDT进化->XGBoost & LightGBM简记
很全面的阐释XGBoost：集成学习之Boosting —— XGBoost 大体来看，XGBoost 在原理方...
深入理解XGBoost
深入理解XGBoost 1. XGBOOST简介 XGBoost的全称是eXtreme Gradient Boos...
How to install xgboost in ubuntu
pip install xgboost Error: Downloading/unpacking xgboost ...
秋招面经
项目相关为什么选取 XGBOOST？ xgboost 相对于 svm、LR 有更好的效果。 xgboost 相对...
Xgboost原理与Sklearn参数详解
目录 1、Xgboost原理 2、总结 1、Xgboost原理 2、总结：本文主要分析了Xgboost和GBDT原...
spark xgboost损失函数和评价函数的修改
spark xgboost自定义损失函数和评价函数一、spark xgboost自定义损失函数 xgboost定...
集成学习之Boosting-xgboost
一、什么是Xgboost 二、Xgboost的基本原理三、Xgboost的工作实例四、算法的优缺点 *****...

网友评论

本文标题：XGBoost

本文链接：https://www.haomeiwen.com/subject/zjbgiqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|XGBoost|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！