机器学习的问题：缺失值的处理

作者: 3b899188980c | 来源:发表于2018-04-07 09:44 被阅读399次

机器学习的问题：缺失值的处理
Python pandas数据预处理
机器学习实战-数据探索(变量变换、生成)
机器学习实战-数据探索(异常值处理)
机器学习（十三）缺失值处理的处理方法总结
机器学习代码经验整合
Series第五讲缺失值处理
机器学习实战-数据探索(缺失值处理)
Kaggle_House题目整理
【python】数据清洗

先具体地总结几类处理方法：

1、最简单的就是用平均值、中值、分位数、众数、随机值等替代；
2、使用其他变量做预测模型来算出缺失值。两个缺陷：如果缺失值与其他变量不相关，那样预测没有意义，但如果特别精准，说明缺失值没有必要加入模型；
3、最精确的做法，把变量映射到高维空间。就是把是否缺失也看成数据的一维。这样做的好处就是完整保留了原始数据的全部信息，不用考虑缺失值，不用考虑线性不可分的问题，但是这种方法计算量太大，而且需要大量的样本。

下面具体分析：

1、缺失值较多的特征处理
如果某个特征缺失值过大，那么我们应该考虑直接将该特征舍弃掉，这时候的特征其实已经可以看做噪声了。
2、缺失值较少的特征处理
直接用0去填充；用均值去填充；用上下数据进行填充；用插值法填充；用算法拟合填充；
大部分情况下使用算法拟合来填充，考虑使用随机森林算法

机器学习的问题：缺失值的处理
先具体地总结几类处理方法： 1、最简单的就是用平均值、中值、分位数、众数、随机值等替代；2、使用其他变量做预测模型...
Python pandas数据预处理
机器学习中学习数据的首要任务是数据预处理 1. 数据缺失值处理不同情况下的数据缺失问题，可以使用不同发方法：针...
机器学习实战-数据探索(变量变换、生成)
《机器学习实战-数据探索(1、变量识别；2、单变量分析；3、双变量分析)》机器学习实战-数据探索(缺失值处理) ...
机器学习实战-数据探索(异常值处理)
《机器学习实战-数据探索(1、变量识别；2、单变量分析；3、双变量分析)》机器学习实战-数据探索(缺失值处理)上...
机器学习（十三）缺失值处理的处理方法总结
1 缺失值产生的原因机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失，比如数据存储的失败，存储器损...
机器学习代码经验整合
该文档是诸位同事机器学习代码学习的经验整合，主要流程为：导入工具包及数据 Features 及其缺失值处理建模...
Series第五讲缺失值处理
Series第五讲缺失值处理本节课将讲解如何处理pandas里的缺失值缺失值处理 Series.fillna...
机器学习实战-数据探索(缺失值处理)
接着上一篇：《机器学习实战-数据探索》介绍，机器学习更多内容可以关注github项目：machine learni...
Kaggle_House题目整理
特征处理缺失比例：属性值含义（不是全部）缺失值处理缺失量比较多的PoolQC、MiscFeature、Al...
【python】数据清洗
1.处理缺失值判断是否含缺失值/统计缺失值筛选所有含缺失值的表格删除含缺失值的数据用新值填充空值对应值替...

网友评论

本文标题：机器学习的问题：缺失值的处理

本文链接：https://www.haomeiwen.com/subject/bmiehftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

机器学习的问题：缺失值的处理

先具体地总结几类处理方法：

下面具体分析：

相关文章

机器学习的问题：缺失值的处理

Python pandas数据预处理

机器学习实战-数据探索(变量变换、生成)

机器学习实战-数据探索(异常值处理)

机器学习（十三）缺失值处理的处理方法总结

机器学习代码经验整合

Series第五讲缺失值处理

机器学习实战-数据探索(缺失值处理)

Kaggle_House题目整理

【python】数据清洗

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读