美文网首页
xgboost是如何处理缺失值的

xgboost是如何处理缺失值的

作者: 小歪与大白兔 | 来源:发表于2018-12-04 12:16 被阅读0次
缺失值的处理办法:
  1. 删除法:
  • 简单删除法:此方法将存在缺失值的数据条目(对象,元组,记录)进行删除
  • 权重法:当缺失值的类型为非完全随机缺失的时候,可以通过对完整的数据加权来减小偏差。把数据不完全的个案标记后,将完整的数据个案赋予不同的权重

2.填补法:

  • 人工填写
  • 特殊值填写
  • 均值填写
  • 出现次数最多的值填写等
xgboost是如何处理缺失值的呢?
  • 在寻找split point的时候,不会对该特征为missing的样本进行遍历统计,只对该列特征值为non-missing的样本上对应的特征值进行遍历,通过这个技巧来减少了为稀疏离散特征寻找split point的时间开销。
  • 在逻辑实现上,为了保证完备性,会分别处理将missing该特征值的样本分配到左叶子结点和右叶子结点的两种情形,计算增益后选择增益大的方向进行分裂即可。
  • 如果在训练中没有缺失值而在预测中出现缺失,那么会自动将缺失值的划分方向放到右子树。


    image.png

相关文章

  • xgboost是如何处理缺失值的

    缺失值的处理办法: 删除法: 简单删除法:此方法将存在缺失值的数据条目(对象,元组,记录)进行删除 权重法:当缺失...

  • xgboost如何处理缺失值

    通常情况下,我们人为在处理缺失值的时候大多会选用中位数、均值或是二者的融合来对数值型特征进行填补,使用出现次数最多...

  • Series第五讲 缺失值处理

    Series第五讲 缺失值处理 本节课将讲解如何处理pandas里的缺失值 缺失值处理 Series.fillna...

  • 2020-08-05--Pandas-03--缺失值处理

    这一章节我们来看下如何使用Pandas处理缺失值。 什么是缺失值 在了解缺失值(也叫控制)如何处理之前,首先要知道...

  • 笔记|数据分析之pandas基础----Series与DataF

    如何处理缺失数据 在练习中经常遇到pandas使用浮点值NaN来表示数组中的缺失数据。那我们该如何处理这些缺失数据...

  • R小姐:缺失值 and 异常值的分析、处理

    现实生活中我们遇到的绝大部分数据都包含有缺失值,因此如何处理缺失值变得尤其重要。 缺失值的处理一般分为两个步骤:缺...

  • 数据的缺失值处理说明

    缺失值说明 缺失值产生的原因 缺失值处理 缺失值说明 缺失数据是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、...

  • Kaggle_House题目整理

    特征处理 缺失比例: 属性值含义(不是全部) 缺失值处理 缺失量比较多的PoolQC、MiscFeature、Al...

  • Pandas_3 处理缺失值、数据透视表以及apply的用法

    1.处理缺失值 Pandas使用NaN(Not a Number)来表示缺失值 1.1判断是否存在缺失值以及缺失值...

  • 【python】数据清洗

    1.处理缺失值 判断是否含缺失值/统计缺失值 筛选所有含缺失值的表格 删除含缺失值的数据 用新值填充空值 对应值替...

网友评论

      本文标题:xgboost是如何处理缺失值的

      本文链接:https://www.haomeiwen.com/subject/jpjmcqtx.html