美文网首页
随机森林

随机森林

作者: SugeonYen | 来源:发表于2019-07-13 14:26 被阅读0次

随机森林的特点

我们前边提到,随机森林是一种很灵活实用的方法,它有如下几个特点:
1.在当前所有算法中,具有极好的准确率
2.能够有效地运行在大数据集上;
3.能够处理具有高维特征的输入样本,而且不需要降维
4.能够评估各个特征在分类问题上的重要性
5.在生成过程中,能够获取到内部生成误差的一种无偏估计
6.对于缺省值问题也能够获得很好得结果

实际上,随机森林的特点不只有这六点,它就相当于机器学习领域的Leatherman(多面手),你几乎可以把任何东西扔进去,它基本上都是可供使用的。在估计推断映射方面特别好用,以致都不需要像SVM那样做很多参数的调试。具体的随机森林介绍可以参见随机森林主页:Random Forest。

方法实现:

回归问题

利用sklearn.ensemble包中的RandomForestRegressor,此函数的重要参数说明:
n_estimators:建立树的个数,也就是上图中的N;
criterion:计算分割点的方法,默认为基尼系数,默认即可;
max_features:随机选择特征的个数,默认为"auto",回归问题默认即可;
max_depth:树的最大深度,默认即可;
min_samples_split:节点数据集中的样本个数等于次数则不再分裂,默认即可;

分类问题

利用sklearn.ensemble包中的RandomForestClassifie,此函数的重要参数说明:
n_estimators:建立树的个数,也就是上图中的N;
criterion:计算分割点的方法,默认为基尼系数,默认即可;
max_features:随机选择特征的个数,默认为"auto",设为“sqrt”;
max_depth:树的最大深度,默认即可;
min_samples_split:节点数据集中的样本个数等于次数则不再分裂,默认即可;
一般,参数的组合选择,可选用交叉验证法获得比较好的参数组合。

daimakuai

daima

相关文章

  • 何为决策树和随机森林?

    随机森林 定义:随机森林或随机决策森林是用于分类、回归和其他任务的集成学习方法。 名字由来:随机森林就是使用随机的...

  • 集成学习之Bagging和RF

    一、什么是随机森林 二、随机森林的两个随机 三、随机森林算法过程 四、为什么如此受欢迎 五、随机森林算法的优缺点 ...

  • (十四、)极限森林

    一、极限森林 特征随机参数随机分裂随机因为分裂是随机的,所以就不需要样本是随机的了 随机森林和极限森林不同之处:随...

  • 随机森林

    https://www.cnblogs.com/fionacai/p/5894142.htmlhttps://ww...

  • 随机森林

    先上重点 GBDT和随机森林虽然都是决策树的组合算法,但是两者的训练过程还是很不相同的。 GBDT训练是每次一棵,...

  • 随机森林

    算法过程 N个训练样本,M个特征 选定特征数目m作为每个决策树的特征,m<

  • 随机森林

    1、什么是随机森林? 随机森林就是用随机的方式建立一个森林,在森林里有很多决策树组成,并且每一棵决策树之间是没有关...

  • 随机森林

    随机森林(RandomForest), 可用于分类或者回归, 相比较决策树的算法, 随机森林是由多棵CART(Cl...

  • 随机森林

    随机森林是一种分类算法,实战中往往比较有用。 简介:如其名,算法里面有一些随机性,另外,主要的思想是很多的决策树(...

  • 随机森林

    随机森林指的是利用多棵树对样本进行训练并预测的一种分类器 01、前言 宠物店里有猫和狗两种宠物,每个动物都有他编号...

网友评论

      本文标题:随机森林

      本文链接:https://www.haomeiwen.com/subject/hizpkctx.html