面试时被问到在随机森林的树是否数量越多越好?开始只考虑构建更多的树一来浪费资源,二来数量一定后模型的性能基本保持稳定,随着树的增加提升非常小。
回来后又想了想,随机森林中通过引入随机抽样和随机抽列,使模型对异常点有更好的鲁棒性,模型的泛化能力更强。如果是无限颗树,那其实会抵消随机性的引入,最后的模型会是一个过拟合的模型,其泛化性能也会降低。此外,噪音较大时,模型也会学习到更多噪音相关的信息,发生过拟合,降低泛化性能。
面试时被问到在随机森林的树是否数量越多越好?开始只考虑构建更多的树一来浪费资源,二来数量一定后模型的性能基本保持稳定,随着树的增加提升非常小。
回来后又想了想,随机森林中通过引入随机抽样和随机抽列,使模型对异常点有更好的鲁棒性,模型的泛化能力更强。如果是无限颗树,那其实会抵消随机性的引入,最后的模型会是一个过拟合的模型,其泛化性能也会降低。此外,噪音较大时,模型也会学习到更多噪音相关的信息,发生过拟合,降低泛化性能。
本文标题:随机森林的树是否越多越好?
本文链接:https://www.haomeiwen.com/subject/ogxbpqtx.html
网友评论