美文网首页
R语言 数据清洗小技巧 如何移除NA值超过一定量的变量

R语言 数据清洗小技巧 如何移除NA值超过一定量的变量

作者: Jason数据分析生信教室 | 来源:发表于2022-04-30 15:04 被阅读0次

每次做数据分析之前必经之路之路就是数据清洗,其中移除缺损值过多的变量是常用手段之一。
每次都会用for循环写一个函数套进去,然鹅有没有更方便快捷的方法呢。当然有,而且不需要用到第三方包。R基本函数就可以解决。
先创建一个数据集

set.seed(0)
dat <- matrix(1:100, 10, 10)
dat[sample(1:100, 50)] <- NA
dat <- data.frame(dat)

然后用colMeans或者rowMeans就可以解决。

  • 删除NA值过半的列
## Remove columns with more than 50% NA
dat[, which(colMeans(!is.na(dat)) > 0.5)]
  • 删除NA值过半的行
## Remove rows with more than 50% NA
dat[which(rowMeans(!is.na(dat)) > 0.5), ]
  • 删除NA值过半的行和列
## Remove columns and rows with more than 50% NA
dat[which(rowMeans(!is.na(dat)) > 0.5), which(colMeans(!is.na(dat)) > 0.5)]

轻松搞定。所以基础很重要。

相关文章

  • R语言 数据清洗小技巧 如何移除NA值超过一定量的变量

    每次做数据分析之前必经之路之路就是数据清洗,其中移除缺损值过多的变量是常用手段之一。每次都会用for循环写一个函数...

  • NA值的填充丨数析学院

    问题 在R中,如何用非NA值替换向量或因素型变量中的NA值? 指南 下列代码将会告诉我们如何填补向量中的空缺,如果...

  • R语言NA值

    在data.frame中,删除列中存在的NA中: 1. 删除one column (eg. 第1列) 中的NA d...

  • R 语言-缺失数据和字符串

    1、缺失数据 缺失值 NA,在 R 中,NA 代表缺失值,NA是不可用,not available 的简称,用来存...

  • 填充NA值为上一个数值

    有时候处理Excel数据时会出现很多NA值,比如将多行数据合并的时候,导入R里面就会发现NA值,对于NA值的填充有...

  • R基础五(字符串)

    缺失信息 R中用NA表示缺失信息。往往很多数据中包含NA值,需要去除。 查看数据集中是否含义缺失值(is.na()...

  • 专题:数据清洗

    python 数据清洗 - Thinkando - 博客园 R 语言数据清洗(常看,加深记忆) - 简书

  • R语言初级教程(12): NA、Inf、NaN、NULL 特殊值

    这几个都是R语言里面的特殊值,都是R的保留字(reserved words)。它们的意义分别为: NA:表示缺失值...

  • R语言数据清洗

    以R语言内置数据集为例 数据简单查看 缺失值处理 异常值 多重共线性 还剩下一些写在思维导图里了,有空转移过来

  • R 函数学习 - complete.cases()

    R语言用complete.cases 和 na.omit去除有空值的行 如果要去除有NA的行,则可用:final[...

网友评论

      本文标题:R语言 数据清洗小技巧 如何移除NA值超过一定量的变量

      本文链接:https://www.haomeiwen.com/subject/lkjyyrtx.html