缺失值

作者: 巴拉巴拉_9515 | 来源:发表于2017-06-17 17:06 被阅读0次
夜夜夜夜

01、缺失值快速定位

格式:要定位的列[空缺的列]

> full$PassengerId[is.na(full$Fare)]
[1] 1044
> full$Name[is.na(full$Fare)]
[1] "Storey, Mr. Thomas"
缺失值快速定位

02、缺失值可视化

VIM包中提供了能可视化数据集中缺失值模式的函数:aggr函数

>a<-full$PassengerId[is.na(full$Age)]  
>length(a)
[1] 263       #263个缺失值

#可视化
library(VIM)  
aggr(full$Age,prop=FALSE,numbers=TRUE)  

红色表示缺失值的情况,蓝色表示非缺失值的情况


缺失值263个

03、数据集缺失值

使用概率表示缺失状况

library(VIM)  
aggr(full,prop=TRUE,numbers=TRUE)

红色表示缺失值的概率,有两个变量缺失值比较严重。


数据集缺失情况

检验一下
(1)survived变量缺失值有多少?

>a<-full$PassengerId[is.na(full$Survived)]  
>length(a)
[1] 418         #418个缺失值

(2)age变量缺失值有多少?

>a<-full$PassengerId[is.na(full$Age)]  
>length(a)
[1] 263       #263个缺失值

(3)Carbin变量是否真的没有缺失值?

>a<-full$PassengerId[is.na(full$Carbin)]  
>length(a)
[1] 0

相关文章

  • 1111总结,missing value,文本操作,datafr

    missing value 缺失值 检测缺失值,丢弃缺失值,填充缺失值,缺失值一般不会被计算 pd.isnull(...

  • 【python】数据清洗

    1.处理缺失值 判断是否含缺失值/统计缺失值 筛选所有含缺失值的表格 删除含缺失值的数据 用新值填充空值 对应值替...

  • Pandas_3 处理缺失值、数据透视表以及apply的用法

    1.处理缺失值 Pandas使用NaN(Not a Number)来表示缺失值 1.1判断是否存在缺失值以及缺失值...

  • 数据的缺失值处理说明

    缺失值说明 缺失值产生的原因 缺失值处理 缺失值说明 缺失数据是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、...

  • 数据挖掘中的预处理

    【数据清洗】Part 1:缺失值处理 忽略元组 人工填写缺失值 使用一个全局常量填充缺失值:例如将缺失值用“Unk...

  • 《机器学习实战》算法总结

    缺失值 使用可用特征的均值来填补缺失值 使用特殊值来填补缺失值,如-1 忽略有缺失值的样本 使用相似样本的均值添补...

  • R数据数据缺失值处理

    处理缺失值的步骤一般为: 识别缺失值 补全个案或删除个案 个案、行都是指代一个意思 识别缺失值 识别缺失值的方法很...

  • day80-数据清洗及数据库连接

    1数据清洗 1.1缺失数据处理 isnull检测缺失值;dropna删除缺失值;python内置的none值在对象...

  • 缺失值判断以及处理

    #####缺失值判断以及处理##### #举例1:向量类型判断缺失值is.na和缺失值的填补which (x<-c...

  • 缺失值处理

    对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补。对于主观数据,人将影响数据的真实性,存在缺失值...

网友评论

      本文标题:缺失值

      本文链接:https://www.haomeiwen.com/subject/tlcbqxtx.html