Ensemble methods

Ensemble methods

作者: 新星_点灯 | 来源:发表于2017-01-13 11:28 被阅读0次

Ensemble methods
2020-04-12 Stacking made easy wi
高级集成学习技巧
BaggingClassifier
1/12Ensemble Methods
StackingClassifier
常见的机器学习模型
scikit-learn--Ensemble methods(集
Ensemble
【机器学习实战】第7章集成方法（随机森林和 AdaBoost）

Bootstrap & Cross-Validation

Bootstrap
有放回抽样，减少不确定性
Cross-Validation
K等分，留一份做测试集其余为训练集；为了模型评估结果的稳定性，常用于特征选择，模型选择，
- Bias-Variance Trade-Off
  K 越大test error(以validation data set 的 error代替)的variance越高，bias越低
  - 经验选择 k=5或10
    - 减少计算量
    - bias - variance trade-off

Bagging, Random Forests

Bagging: Bootstrap aggregation
用bootstrap方法得到B个数据集（每个数据集包含n个数据），以B个数据集建立B个模型，最终结果为所有模型结果的平均（或多数投票）
Out of Bag Error Estimation (OOB)
平均每次只有2/3的样本会进入训练模型，剩下的1/3可用来计算测试集误差。平均每个样本会B/3次出现在测试集中，计算误差时取均值。
若用决策树，每棵树都完全生长不剪枝
单颗树low bias, high variance;再结合Bagging的方法降低variance；B越大越好，经验值取100
Random Forests
RF在bagged trees的基础上通过随机选取特征来降低树与树之间的相关性。
- bagged trees模型若变量中有部分变量有较强预测性，则生成的各颗树相似度较高。不能显著降低模型variance。
m 的经验值为√p, 在相关变量较多时宜使用较小的m

Boosting

与bagging的区别
bagged trees中的树是各自建立在自己的抽样的数据集上，训练过程独立；Boosting方法中树是依次建立的并且没有使用bootstrap抽样；Boosting是一群弱分类器的加权组合；
Boosting有三个重要参数
- 树的个数：树太多时会过拟合，通常用cross-validation来确定树的个数
- 树的深度：通常深度为1
- 学习率：通常为0.01或0.001，较小的学习率需要较多的树。
Boosting方法训练时每棵树会考虑前面树的效果，因此宜使用较简单的树（深度小）；另外简单的树有较高的解释性（如用stumps构成additive model）
Boosting算法的实现
- AdaBoost（Adaptive Boosting）
- XGboost
  Extreme Gradient Boosting

Reference：
《Introduction to statistical learning》
《Machine learning in action》

相关文章

Ensemble methods
Bootstrap & Cross-Validation Bootstrap有放回抽样，减少不确定性 Cross-...
2020-04-12 Stacking made easy wi
Introduction The underlying principle of ensemble methods...
高级集成学习技巧
Examined ensemble methods Averaging (or blending) Weighte...
BaggingClassifier
写在前面 Ensemble methods 组合模型的方式大致为四个：/bagging / boosting / ...
1/12Ensemble Methods
Why Would We Want to Ensemble Learners Together? There ar...
StackingClassifier
写在前面 scikit-learn 官网的Ensemble methods 文档部分只介绍了/bagging / ...
常见的机器学习模型
0. 写在前面的话本文中的内容节选自周志华的《Ensemble Methods: Foundations and...
scikit-learn--Ensemble methods(集
集成方法的目的是通过结合很多基学习器来增强泛化和鲁棒性。两种集成方法： averaging methods，主要原...
Ensemble
集成学习（ensemble learning）：Stacking，boosting，bagging（bootstr...
【机器学习实战】第7章集成方法（随机森林和 AdaBoost）
第7章集成方法 ensemble method 集成方法: ensemble method（元算法: meta ...

网友评论

本文标题：Ensemble methods

本文链接：https://www.haomeiwen.com/subject/bpmhbttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Ensemble methods|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！