美文网首页
随机森林算法

随机森林算法

作者: 大龙10 | 来源:发表于2023-12-20 12:56 被阅读0次

书名:计算机视觉40例从入门到深度学习:OpenCV-Python
作者:李立宗
出版社:电子工业出版社
出版时间:2022-07-01
ISBN:9787121436857


第15章 机器学习导读

15.3 OpenCV中的机器学习模块

15.3.2 决策树

三、随机森林算法

1、Bagging算法
  • 训练数据的划分对算法的性能有直接影响。
    如果将训练数据直接划分为N份,让集成中的每个个体学习器学习,那么每个个体学习器所面对的训练数据不相同,因此它们的模型也不同。
    这相当于构建了一个一盘散沙的军队,大家各司其职,每个人的战斗力都很强,但是由于缺乏协作,未必有打胜仗的能力。
    针对此情况,Bagging算法是一种解决方案,该算法采用相互有交叉的训练子集训练模型。

  • 相互有交叉的训练子集是通过有放回的采样方式进行采样获得的。
    例如,有一组训练数据里面有n个样本,如果想从中取出存在交叉(重复)的包含n个样本的采样数据,那么可以通过有放回地取n次实现。
    操作时,每次取出1个样本,记住该样本的数值后再将其放回,以使该样本在下次采样时仍有可能被选中,依次类推,取n次完成采样。
    通过上述方式,保证最终取到的n个样本是可能包含重复样本的采样数据。
    或者说,初始样本集中的样本有的在最终样本集中会出现多次,有的并没有出现。

  • 采用上述方式,采样出N组包含n个测试样本的采样数据,然后基于每组采样数据训练出一个个体学习器,最后将这些个体学习器加权组合,构成集成。

  • 上述是Bagging算法的基本流程。
    该过程与直接划分样本集相比,采用了有交叉样本集。也
    就是说,不同的个体学习器面对的训练数据既有个性化的值,又有共性化的值。进一步说,不同的个体学习器具备协同作战的能力。

使用时,Bagging算法针对分类任务采用简单投票法,针对回归任务采用简单平均法。

2、随机森林算法
  • 随机森林算法是Bagging算法的一种变换形式。
    随机森林算法在以决策树作为个体学习器构建Bagging集成的基础上,在决策树的过程中引入了随机属性选择。
    简单来说,传统的决策树在选择划分属性时是在所有的属性集中选择一个最优的;而随机森林算法每次选择划分属性时,先从属性集中选择一个子集(所有集合的一部分),然后从该子集中选择一个最优的。

  • 随机森林算法的实现思路简单方便且计算量小,在实践中具有超乎想象的强大性能,被誉为“代表集成学习技术水平的方法”。
    随机森林算法不仅在样本选择时采用了随机方式(Bagging算法使用的方法),而且在选择属性时也使用了随机方式,这使得最终模型的泛化性能通过个体学习器的差异增加得到了进一步提升。

相关文章

  • 集成学习之Bagging和RF

    一、什么是随机森林 二、随机森林的两个随机 三、随机森林算法过程 四、为什么如此受欢迎 五、随机森林算法的优缺点 ...

  • 常用的算法总结

    风控模型常用的算法总结 一、常用算法 监督算法 随机森林采用投票机制,xgb则是弱学习机的集合。随机森林关注方差,...

  • 1 . spark ml 随机森林练习代码讲解

    一,算法简介 随机森林是决策树的集成算法。随机森林包含多个决策树来降低过拟合的风险。随机森林同样具有易解释性、可处...

  • 随机森林算法

    异常

  • 随机森林算法

    转载自:http://www.zilhua.com/629.html 1. 随机森林使用背景 1.1 随机森林定义...

  • 随机森林算法

    1.随机森林使用背景 1.1随机森林定义 随机森林是一种比较新的机器学习模型。经典的机器学习模型是神经网络,有半个...

  • 随机森林算法梳理

    随机森林分类器是一种基于装袋(bagging)全称Bootstrap Aggregation。的集成算法 随机森林...

  • (十三、)随机森林

    一、原理 随机森林:属性随机、样本随机多个算法,合到一起,共同发挥作用 取长补短 随机森林 提高准确率,防止过拟合...

  • 随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(Ma

    随机森林算法预测法官判决,准确度优于人类水平 近日,Science 报道了一种利用最高法院数据库和随机森林算法构建...

  • 机器学习(九) 随机森林

    随机森林是在Bagging策略的基础上进行修改后的一种算法。 随机:数据采样随机,特征选择随机 森林:很多个决策树...

网友评论

      本文标题:随机森林算法

      本文链接:https://www.haomeiwen.com/subject/brcogdtx.html