Manipulating Data - 重计算数据框所有因子列的

作者: 王诗翔 | 来源:发表于2018-01-04 19:32 被阅读16次

Manipulating Data - 重计算数据框所有因子列的
Manipulating Data - 对数据框的列重新排序
Manipulating Data - 重命名数据框的列
Manipulating Data - 比较数据框
Manipulating Data - 数据框与列联表转换
Manipulating Data - 添加和移除数据框的列
R|inspectdf
Manipulating Data - 融合数据框
2.6.2 数据框（data.frame）
R语言数据框添加行或列数据2021.5.28

重计算数据框所有因子列的水平

问题

你想要重新计算一个数据框中所有因子列（变量）的因子水平。

方案

有时候在读入和清理数据之后，你会发现数据（数据框）结果中有的因子列有一些不存在的因子水平。

例如，下面的d有一个空行。当它被读入时，因子列会出现""水平，它不应该是数据的一部分。

d <- read.csv(header = TRUE, text='
x,y,value
a,one,1
,,5
b,two,4
c,three,10
')

d
#>   x     y value
#> 1 a   one     1
#> 2             5
#> 3 b   two     4
#> 4 c three    10

str(d)
#> 'data.frame':    4 obs. of  3 variables:
#>  $ x    : Factor w/ 4 levels "","a","b","c": 2 1 3 4
#>  $ y    : Factor w/ 4 levels "","one","three",..: 2 1 4 3
#>  $ value: int  1 5 4 10

即便移除了空行，因子中仍有""水平：

# 移除第二行
d <- d[-2,]
d
#>   x     y value
#> 1 a   one     1
#> 3 b   two     4
#> 4 c three    10

str(d)
#> 'data.frame':    3 obs. of  3 variables:
#>  $ x    : Factor w/ 4 levels "","a","b","c": 2 3 4
#>  $ y    : Factor w/ 4 levels "","one","three",..: 2 4 3
#>  $ value: int  1 4 10

使用`droplevels`

最简单的方式是使用droplevels()函数：

d1 <- droplevels(d)
str(d1)
#> 'data.frame':    3 obs. of  3 variables:
#>  $ x    : Factor w/ 3 levels "a","b","c": 1 2 3
#>  $ y    : Factor w/ 3 levels "one","three",..: 1 3 2
#>  $ value: int  1 4 10

使用`vapply` 和 `lapply`

为了重新计算所有因子列的水平，我们使用以is.factor()为参数的vapply()函数去找出哪些列是因子，然后再利用以factor()函数为参数的lapply()操作将那些列重新计算因子水平。

# 找出哪些列是因子
factor_cols <- vapply(d, is.factor, logical(1))

# 把factor()函数应用到那些列，并把结果赋回d
d[factor_cols] <- lapply(d[factor_cols], factor)
str(d)
#> 'data.frame':    3 obs. of  3 variables:
#>  $ x    : Factor w/ 3 levels "a","b","c": 1 2 3
#>  $ y    : Factor w/ 3 levels "one","three",..: 1 3 2
#>  $ value: int  1 4 10

另见

关于重计算一个因子变量水平的信息，参见 ../Re-computing_the_levels_of_factor.

网友评论

本文标题：Manipulating Data - 重计算数据框所有因子列的

本文链接：https://www.haomeiwen.com/subject/hcldnxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Manipulating Data - 重计算数据框所有因子列的

重计算数据框所有因子列的水平

问题

方案

使用`droplevels`

使用`vapply` 和 `lapply`

另见

相关文章

Manipulating Data - 重计算数据框所有因子列的

Manipulating Data - 对数据框的列重新排序

Manipulating Data - 重命名数据框的列

Manipulating Data - 比较数据框

Manipulating Data - 数据框与列联表转换

Manipulating Data - 添加和移除数据框的列

R|inspectdf

Manipulating Data - 融合数据框

2.6.2 数据框（data.frame）

R语言数据框添加行或列数据2021.5.28

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

数据-R语言-图表-决策-Linux-Python

R语言与统计分析

Cook R

数据科学与R语言

诗翔的R语言学习之路

Manipulating Data - 重计算数据框所有因子列的

重计算数据框所有因子列的水平

问题

方案

使用droplevels

使用vapply 和 lapply

另见

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

使用`droplevels`

使用`vapply` 和 `lapply`