美文网首页
树模型缺失值处理总结

树模型缺失值处理总结

作者: 文哥的学习日记 | 来源:发表于2018-10-09 00:13 被阅读420次

本篇文章来总结一下树模型缺失值处理的方法

1、决策树

对普通的决策树来说,缺失值需要注意三个方面的问题:

  1. 在选择分裂属性的时候,训练样本存在缺失值,如何处理?
  2. 在建树过程中,给定划分属性,若样本在该属性上的值是缺失的,那么该如何对这个样本进行划分?
  3. 训练完成,给测试集样本分类,有缺失值怎么办?

针对前两个问题,可以参考文献:https://blog.csdn.net/u012328159/article/details/79413610

针对第三个问题,通常选择样本数最多的特征值方向。

2、XGBoost

XGBoost处理缺失值,是将所有有缺失值的数据捆绑在一起,比较将这些数据都放入左子树 和都放入右子树时的损失大小。

参考文献

1、决策树(decision tree)(四)——缺失值处理:https://blog.csdn.net/u012328159/article/details/79413610
2、怎么理解决策树、xgboost能处理缺失值?而有的模型(svm)对缺失值比较敏感呢?:https://www.zhihu.com/question/58230411

相关文章

  • 树模型缺失值处理总结

    本篇文章来总结一下树模型缺失值处理的方法 1、决策树 对普通的决策树来说,缺失值需要注意三个方面的问题: 在选择分...

  • 其他处理

    缺失值处理 美团“猜你喜欢”深度学习排序模型实践

  • Series第五讲 缺失值处理

    Series第五讲 缺失值处理 本节课将讲解如何处理pandas里的缺失值 缺失值处理 Series.fillna...

  • 1-4 决策树的几点补充

    包括:连续值处理、缺失值处理、使用多变量进行节点划分。 1. 连续值处理 决策树进行节点划分一般是针对离散值的,但...

  • 特征工程在神经网络和一般模型中的一点不同

    在一般模型,典型地例如树模型中,人工地尽可能丰富特征往往十分必要。在对原始数据进行缺失值、异常值、归一化等处理后,...

  • Pandas_3 处理缺失值、数据透视表以及apply的用法

    1.处理缺失值 Pandas使用NaN(Not a Number)来表示缺失值 1.1判断是否存在缺失值以及缺失值...

  • 分类算法处理缺失值

    整体而言,树模型+bayes对于缺失值都不太敏感;涉及到度量问题的模型(SVM+KNN)就相对敏感。 决策树 其实...

  • Kaggle_House题目整理

    特征处理 缺失比例: 属性值含义(不是全部) 缺失值处理 缺失量比较多的PoolQC、MiscFeature、Al...

  • 【python】数据清洗

    1.处理缺失值 判断是否含缺失值/统计缺失值 筛选所有含缺失值的表格 删除含缺失值的数据 用新值填充空值 对应值替...

  • 机器学习 - 特征工程

    数据处理 缺失值处理行数据缺失过多,用户区分度就会降低,列数据缺失过多会导致建模存在偏差fillna:填充缺失值;...

网友评论

      本文标题:树模型缺失值处理总结

      本文链接:https://www.haomeiwen.com/subject/hjssaftx.html