美文网首页机器学习
2020机器学习决策树(3)

2020机器学习决策树(3)

作者: zidea | 来源:发表于2020-08-28 20:33 被阅读0次

使用 RF(随机森林) 建立计算样本间的相似度

原理:若两个样本同时出现在相同叶节点的次数越多,则两者越相似
算法

  • 记样本个数为 N,初始化N \times N的零矩阵 S S[i,j]表示样本 i 和样本 j 的相似度
  • 对于 m 颗决策树形成随机森林,遍历所有决策树的所有叶子节点:
    • 即该叶子节点包含的样本为 sample[1,2,...,k] 则 S[i,j]累1.
      • 样本 i,j \in sample[1,2,\dots,k]
      • 样本 i,j 出现在相同叶子节点的次数增加1次
  • 遍历结束,则 S 为样本间相似度矩阵

使用随机森林计算特征重要度

  • 随森林是常用的衡量特征重要性的方法。
    也就是如果某一个特征作为分类依据被使用比较多,那么就说明这个特征根 y 的相关性比较强。所以通过决策树,??
    • 计算正例经过的节点,使用进过节点的数目、经过节点的 gini 系数和等指标。或者,随机替换一列数据,重新建立决策树,计算新模型的正确变化率,从而考虑这一列特征的重要性。
  • selection frequency
  • gini importance
  • permutation importance

相关文章

  • 2020机器学习决策树(3)

    CART 表示 均值 j 选择 x 某一个的维度 L 是距离函数 s 表示选取的分割位置 我们在变量 x 的 j...

  • 2020机器学习决策树(3)

    使用 RF(随机森林) 建立计算样本间的相似度 原理:若两个样本同时出现在相同叶节点的次数越多,则两者越相似算法 ...

  • Python实现决策树的构建

    Python机器学习-决策树的构建 决策树(ID3算法) 开发环境为anaconda中的spyder,所有库已经默...

  • [机器学习]决策树

    决策树 @(技术博客)[机器学习, 决策树, python] 学习决策树首先要搞清楚决策树是什么(what),在弄...

  • 6.machine_learning_Decision_Tree

    1 机器学习决策树 1.1机器学习中的决策树模型 ① 树模型不用做scaling ② 树模型不太需要做离散化 ③ ...

  • 机器学习实战Py3.x填坑记—决策树

    在输入完程序清单3-5之后运行命令: 遇到问题搜索如下参考:[机器学习&数据挖掘]机器学习实战决策树plotTre...

  • SVM 随笔

    前言 当下机器学习比较重要 3 中算法,个人都目前为止认为比较重要机器学习算法分别是,深度学习、SVM 和决策树。...

  • 机器学习3|决策树

  • 机器学习 | 决策树及若干基础问题

    决策树 1.构造决策树 学习决策树就是学习一系列if/else问题,是我们能够以最快的速度得到正确答案。在机器学习...

  • 机器学习之决策树

    原文地址 决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中...

网友评论

    本文标题:2020机器学习决策树(3)

    本文链接:https://www.haomeiwen.com/subject/ughwehtx.html