决策树系列

作者: 邓沉香 | 来源:发表于2019-07-14 08:49 被阅读0次

    决策树:

    • 特征选择准则
    1. 信息增益(ID3)
    2. 信息增益比(C4.5)
    3. GINI指数(用于CART中分类树生成)
    • 剪枝

    1. 信息增益(ID3):
      g(D,A)=H(D)-H(D|A)
      其中g(D,A)为所计算的增益值,其中参数D为整个训练样本集合,A为样本的某一特征。
      H(D)=-\displaystyle \sum^{K}_{k=1}{\frac{|C_k|}{|D|}}\log(\frac{|C_k|}{|D|})
      其中C_k表示样本集合D被分成k类之后每一类的样本集合,|C_k|则表示该集合的样本个数。|D|同理。
      H(D|A)=\displaystyle \sum^{n}_{i=1}{\frac{|D_i|}{|D|}}H(D_i)=-\displaystyle \sum^{n}_{i=1}{\frac{|D_i|}{|D|}}\displaystyle \sum^{K}_{k=1}{\frac{|D_{ik}|}{|D_i|}}\log(\frac{|D_{ik}|}{|D_i|})

    相关文章

      网友评论

        本文标题:决策树系列

        本文链接:https://www.haomeiwen.com/subject/gpxbkctx.html