美文网首页
随机森林

随机森林

作者: 0xFFFFFG | 来源:发表于2019-06-13 15:00 被阅读0次

集成学习(ensemble)

由多种算法给出判断结果并投票,以一定的原则综合这些投票并进行决策.
e.g. 病情确诊
sk-learn中提供了Voting Classifier接口

# hard voting classifier,少数服从多数
voting_clf = VotingClassifier(estimators=[
    ('log_clf',LogisticRegression()),
    ('svc_clf',SVC()),
    ('dt_clf',DecisionTreeClassifier())
])
voting_clf.fit(X_train,y_train)
voting_clf.score(X_test,y_test)

#soft voting classifier,每个分类在所有投票中给出的概率相加,取概率最大的分类
voting_clf = VotingClassifier(estimators=[
    ('log_clf',LogisticRegression()),
    ('svc_clf',SVC(probability=True)),
    ('dt_clf',DecisionTreeClassifier())
],voting='soft')
voting_clf.fit(X_train,y_train)
voting_clf.score(X_test,y_test)

局限:虽然有很多的机器学习方法,但是从投票的角度看,仍然不够多
解决方案:创建更多的不一致的子模型,集成更多的子模型额的意见
子模型准确率-子模型数量和集成学习准确率的关系如下


20190612121003.jpg

取样方式分为bagging(放回取样,在统计学中称bootstrap)和pasting(不放回取样)

随机森林

对样本数据随机取部分特征和部分样本训练决策树模型,最后对所有决策树模型进行集成学习的算法

相关文章

  • 何为决策树和随机森林?

    随机森林 定义:随机森林或随机决策森林是用于分类、回归和其他任务的集成学习方法。 名字由来:随机森林就是使用随机的...

  • 集成学习之Bagging和RF

    一、什么是随机森林 二、随机森林的两个随机 三、随机森林算法过程 四、为什么如此受欢迎 五、随机森林算法的优缺点 ...

  • (十四、)极限森林

    一、极限森林 特征随机参数随机分裂随机因为分裂是随机的,所以就不需要样本是随机的了 随机森林和极限森林不同之处:随...

  • 随机森林

    https://www.cnblogs.com/fionacai/p/5894142.htmlhttps://ww...

  • 随机森林

    先上重点 GBDT和随机森林虽然都是决策树的组合算法,但是两者的训练过程还是很不相同的。 GBDT训练是每次一棵,...

  • 随机森林

    算法过程 N个训练样本,M个特征 选定特征数目m作为每个决策树的特征,m<

  • 随机森林

    1、什么是随机森林? 随机森林就是用随机的方式建立一个森林,在森林里有很多决策树组成,并且每一棵决策树之间是没有关...

  • 随机森林

    随机森林(RandomForest), 可用于分类或者回归, 相比较决策树的算法, 随机森林是由多棵CART(Cl...

  • 随机森林

    随机森林是一种分类算法,实战中往往比较有用。 简介:如其名,算法里面有一些随机性,另外,主要的思想是很多的决策树(...

  • 随机森林

    随机森林指的是利用多棵树对样本进行训练并预测的一种分类器 01、前言 宠物店里有猫和狗两种宠物,每个动物都有他编号...

网友评论

      本文标题:随机森林

      本文链接:https://www.haomeiwen.com/subject/owekfctx.html