一文看懂集成学习（详解 bagging、boosting 以及他

一文看懂集成学习（详解 bagging、boosting 以及他

作者: easyAI人工智能知识库 | 来源:发表于2019-10-17 16:26 被阅读0次

一文看懂集成学习（详解 bagging、boosting 以及他
Ensemble
机器学习-集成学习
集成学习方法（组合分类器）
集成学习
《统计学习方法》之随机森林Random Forest
Bagging与随机森林
Boosting
CV-模型集成
随机森林：这或许是集成学习中最经典的一个 Bagging 算法了

一文看懂集成学习

在机器学习中，我们讲了很多不同的算法。那些算法都是单打独斗的英雄。而集成学习就是将这些英雄组成团队。实现“3 个臭皮匠顶个诸葛亮”的效果。

本文将介绍集成学习的 2 种主要思路：bagging、boosting。

什么是集成学习？

集成学习归属于机器学习，他是一种「训练思路」，并不是某种具体的方法或者算法。

现实生活中，大家都知道「人多力量大」，「3 个臭皮匠顶个诸葛亮」。而集成学习的核心思路就是「人多力量大」，它并没有创造出新的算法，而是把已有的算法进行结合，从而得到更好的效果。

集成学习知识结构

集成学习会挑选一些简单的基础模型进行组装，组装这些基础模型的思路主要有 2 种方法：

bagging（bootstrap aggregating的缩写，也称作“套袋法”）
boosting

Bagging

bagging核心思路

Bagging 的核心思路是——民主。

Bagging 的思路是所有基础模型都一致对待，每个基础模型手里都只有一票。然后使用民主投票的方式得到最终的结果。

大部分情况下，经过 bagging 得到的结果方差（variance）更小。

bagging的具体过程

具体过程：

从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本（在训练集中，有些样本可能被多次抽取到，而有些样本可能一次都没有被抽中）。共进行k轮抽取，得到k个训练集。（k个训练集之间是相互独立的）
每次使用一个训练集得到一个模型，k个训练集共得到k个模型。（注：这里并没有具体的分类算法或回归方法，我们可以根据具体问题采用不同的分类或回归方法，如决策树、感知器等）
对分类问题：将上步得到的k个模型采用投票的方式得到分类结果；对回归问题，计算上述模型的均值作为最后的结果。（所有模型的重要性相同）

举例：

在 bagging 的方法中，最广为熟知的就是随机森林了：bagging + 决策树 = 随机森林

《一文看懂决策树（3个步骤+3种典型算法+10个优缺点）》

《一文看懂随机森林（4个步骤+4种方式评测+10个优缺点）》

Boosting

boosting核心思路

Boosting 的核心思路是——挑选精英。

Boosting 和 bagging 最本质的差别在于他对基础模型不是一致对待的，而是经过不停的考验和筛选来挑选出「精英」，然后给精英更多的投票权，表现不好的基础模型则给较少的投票权，然后综合所有人的投票得到最终结果。

大部分情况下，经过 boosting 得到的结果偏差（bias）更小。

boosting的具体过程

具体过程：

通过加法模型将基础模型进行线性的组合。
每一轮训练都提升那些错误率小的基础模型权重，同时减小错误率高的模型权重。
在每一轮改变训练数据的权值或概率分布，通过提高那些在前一轮被弱分类器分错样例的权值，减小前一轮分对样例的权值，来使得分类器对误分的数据有较好的效果。

举例：

在 boosting 的方法中，比较主流的有 Adaboost 和 Gradient boosting 。

《一文看懂 Adaboost 以及它的优缺点》

Bagging 和 Boosting 的4 点差别

Bagging和Boosting的4点差别

样本选择上：

Bagging：训练集是在原始集中有放回选取的，从原始集中选出的各轮训练集之间是独立的。

Boosting：每一轮的训练集不变，只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。

样例权重：

Bagging：使用均匀取样，每个样例的权重相等

Boosting：根据错误率不断调整样例的权值，错误率越大则权重越大。

预测函数：

Bagging：所有预测函数的权重相等。

Boosting：每个弱分类器都有相应的权重，对于分类误差小的分类器会有更大的权重。

并行计算：

Bagging：各个预测函数可以并行生成

Boosting：各个预测函数只能顺序生成，因为后一个模型参数需要前一轮模型的结果。

差别部分内容转自《Bagging和Boosting 概念及区别》
本文首发自产品经理的 AI 学习库 easyai.tech

相关文章

一文看懂集成学习（详解 bagging、boosting 以及他
在机器学习中，我们讲了很多不同的算法。那些算法都是单打独斗的英雄。而集成学习就是将这些英雄组成团队。实现“3 个臭...
Ensemble
集成学习（ensemble learning）：Stacking，boosting，bagging（bootstr...
机器学习-集成学习
outline 集成学习 Boosting Bagging 随机森林结合策略 Stacking 集成学习(ens...
集成学习方法（组合分类器）
1. 引言典型的集成学习方法有bagging, boosting以及随机森林，stacking也是一种集成学...
集成学习
集成学习与个体学习器集成学习是机器学习中常用的一种方法，常用的集成学习方法有boosting,bagging以及...
《统计学习方法》之随机森林Random Forest
1. Bagging和Boosting 在集成学习方法中，Bagging和Boosting是具有代表性的两大方法，...
Bagging与随机森林
序集成学习大类中常见的有两个子类：Bagging和Boosting。本次记录一下Bagging以及其代表模型Ra...
Boosting
序 boosting是集成学习中的一个大家族，本次记录boosting的相关概念以及与bagging的区别。 bo...
CV-模型集成
集成学习方法集成学习能够提高预测精度，常见的集成学习方法有stacking、bagging和boosting，同...
随机森林：这或许是集成学习中最经典的一个 Bagging 算法了
在集成学习概述中已经知道了常用的集成算法有两种：Bagging 和 Boosting。而在 Bagging 中，随...

网友评论

本文标题：一文看懂集成学习（详解 bagging、boosting 以及他

本文链接：https://www.haomeiwen.com/subject/yskvmctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|一文看懂集成学习（详解 bagging、boosting 以及他|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！