机器学习—随机森林（Random Forest）

机器学习—随机森林（Random Forest）

作者: Bobby0322 | 来源:发表于2019-03-21 16:48 被阅读0次

随机森林原理(接着上次的决策树)
在线作图|在线做随机森林分析
【机器学习】随机森林(Random Forest)
机器学习—随机森林（Random Forest）
随机森林（Random Forest）
随机森林 Random forest
随机森林/RF（Random Forest）
【转】随机森林（Random Forest）
C6_Decision Tree 决策树初探以及安装Graph
随机森林、EM、HMM、LDA

Bagging思想

Bagging是bootstrap aggregating。思想就是从总体样本当中随机取一部分样本进行训练，通过多次这样的结果，进行投票获取平均值作为结果输出，这就极大可能的避免了不好的样本数据，从而提高准确度。因为有些是不好的样本，相当于噪声，模型学入噪声后会使准确度不高。

举个例子：

假设有1000个样本，如果按照以前的思维，是直接把这1000个样本拿来训练，但现在不一样，先抽取800个样本来进行训练，假如噪声点是这800个样本以外的样本点，就很有效的避开了。重复以上操作，提高模型输出的平均值。

随机森林

RandomForest(随机森林)是一种基于树模型的Bagging的优化版本，一棵树的生成肯定还是不如多棵树，因此就有了随机森林，解决决策树泛化能力弱的特点。(可以理解成三个臭皮匠顶过诸葛亮)

而同一批数据，用同样的算法只能产生一棵树，这时Bagging策略可以帮助我们产生不同的数据集。Bagging策略来源于bootstrap aggregation：从样本集（假设样本集N个数据点）中重采样选出Nb个样本（有放回的采样，样本数据点个数仍然不变为N），在所有样本上，对这n个样本建立分类器（ID3\C4.5\CART\SVM\LOGISTIC），重复以上两步m次，获得m个分类器，最后根据这m个分类器的投票结果，决定数据属于哪一类。

总的来说就是随机选择样本数，随机选取特征，随机选择分类器，建立多颗这样的决策树，然后通过这几课决策树来投票，决定数据属于哪一类(投票机制有一票否决制、少数服从多数、加权多数)

优点：

在当前的很多数据集上，相对其他算法有着很大的优势，表现良好。
它能够处理很高维度（feature很多）的数据，并且不用做特征选择(因为特征子集是随机选择的)。
在训练完后，它能够给出哪些feature比较重要。
训练速度快，容易做成并行化方法(训练时树与树之间是相互独立的)。
在训练过程中，能够检测到feature间的互相影响。
对于不平衡的数据集来说，它可以平衡误差。
如果有很大一部分的特征遗失，仍可以维持准确度。

缺点：

随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟合。
对于有不同取值的属性的数据，取值划分较多的属性会对随机森林产生更大的影响，所以随机森林在这种数据上产出的属性权值是不可信的。

相关文章

随机森林原理(接着上次的决策树)
随机森林(random forest) Random Forest 流程:bagging(bootstrap ag...
在线作图|在线做随机森林分析
随机森林（Random forest）随机森林（Random forest）是利用多棵决策树对样本进行训练并预测...
【机器学习】随机森林(Random Forest)
随机森林是一个最近比较火的算法 1、它有很多的优点：在数据集上表现良好在当前的很多数据集上，相对其他算法有着很...
机器学习—随机森林（Random Forest）
Bagging思想 Bagging是bootstrap aggregating。思想就是从总体样本当中随机取一部分...
随机森林（Random Forest）
随机森林（较详细） #1决策树学习 #2随机森林（1）属于集成学习（Ensemble Learning）的方法。...
随机森林 Random forest
第一个问题：随机森林的定义Random forest 随机森林是由很多决策树（Decision Tree）构成的，...
随机森林/RF（Random Forest）
随机森林通过将 Bagging 和决策树相结合，使其结果不仅具有决策树一样强大的拟合能力，而且泛化能力相比决策...
【转】随机森林（Random Forest）
作者：Poll的笔记博客：http://www.cnblogs.com/maybe2030/p/4585705.h...
C6_Decision Tree 决策树初探以及安装Graph
决策树和svm一样是一种通用机器学习算法既可以做回归，也可以做分类同时也是Random Forest 随机森林的基...
随机森林、EM、HMM、LDA
随机森林（Random Forest）是一种分类和回归算法，它包含了多个决策树，形成一个森林，随机森林的类别是所有...

网友评论

本文标题：机器学习—随机森林（Random Forest）

本文链接：https://www.haomeiwen.com/subject/crscvqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|机器学习—随机森林（Random Forest）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！