美文网首页
缺失值可视化

缺失值可视化

作者: Hello育种 | 来源:发表于2021-08-21 15:00 被阅读0次
  数据集中往往存在缺失值,在进行数据分析前需要了解数据的缺失值情况。R语言中的一些基本函数可用于查询缺失数据,另外还有一些第三方包可用于查询和处理数据缺失。

 基本的缺失值查询可以通过is.na()和complete.cases()函数,当存在缺失值NA或者NAN时is.na()返回TRUE, complete.cases()则返回FALSE。
image.png

mice包函数md.pattern(x),可以以矩阵或者数据框的形式展示缺失值。输出的表格中,1表示列中不存在缺失值,0表示存在缺失值。返回的第一列表示缺失值模式的实例个数,最后一列表示各模式有缺失值的变量个数,最后一行表示每列缺失值的个数,整个表格最右下角的值表示总的缺失值个数。

image.png

除此之外,VIM包中的aggr函数可以对缺失值进行可视化探索。参数prop为TRUE图形中显示缺失值比例, 为FALSE显示缺失值个数, 默认combined = FALSE,输出两张图,左侧为缺失值数量的柱状图。


image.png image.png
image.png

参考:
————————————————
版权声明:本文为CSDN博主「Kingsley_W」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/wltom1985/article/details/79200245

相关文章

  • 缺失值

    01、缺失值快速定位 格式:要定位的列[空缺的列] 02、缺失值可视化 VIM包中提供了能可视化数据集中缺失值模式...

  • 缺失值可视化

    mice包函数md.pattern(x),可以以矩阵或者数据框的形式展示缺失值。输出的表格中,1表示列中不存在缺失...

  • 1111总结,missing value,文本操作,datafr

    missing value 缺失值 检测缺失值,丢弃缺失值,填充缺失值,缺失值一般不会被计算 pd.isnull(...

  • Python数据处理(一)

    1缺失值处理 2数据描述统计 涉及数据的相关性、缺失性、取值分布统计、头尾数据展示、热力图可视化。 3 数据集打乱

  • 【python】数据清洗

    1.处理缺失值 判断是否含缺失值/统计缺失值 筛选所有含缺失值的表格 删除含缺失值的数据 用新值填充空值 对应值替...

  • Pandas_3 处理缺失值、数据透视表以及apply的用法

    1.处理缺失值 Pandas使用NaN(Not a Number)来表示缺失值 1.1判断是否存在缺失值以及缺失值...

  • 数据的缺失值处理说明

    缺失值说明 缺失值产生的原因 缺失值处理 缺失值说明 缺失数据是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、...

  • R|inspectdf

    inspectdf主要针对数据框(data frames)的列信息汇总、对比和可视化。具体内容包括报告缺失值,因子...

  • 评分卡模型开发-数据集缺失值处理

    更新内容:missingno库可视化缺失值 在实际的应用过程中,样本由于各种原因缺少一个或多个值的情况并不少见,其...

  • 数据挖掘中的预处理

    【数据清洗】Part 1:缺失值处理 忽略元组 人工填写缺失值 使用一个全局常量填充缺失值:例如将缺失值用“Unk...

网友评论

      本文标题:缺失值可视化

      本文链接:https://www.haomeiwen.com/subject/zaytiltx.html