目录
R语言第二章数据处理①选择列
R语言第二章数据处理②选择行
R语言第二章数据处理③删除重复数据
R语言第二章数据处理④数据框排序和重命名
R语言第二章数据处理⑤数据框列的转化和计算
=========================================
正文
本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数:
Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。
Transmutate():计算新列但删除现有变量。
同时还有mutate()和transmutate()的三个变体来一次修改多个列:
Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。
Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列
Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列
- mutate:通过保留现有变量来添加新变量,通过保留现有列来添加新列(sepal_by_petal):
library(tidyverse)
my_data <- as_tibble(iris)
my_data
my_data %>%
mutate(sepal_by_petal_l = Sepal.Length/Petal.Length)
- transmute:通过删除现有变量来创建新变量,删除现有列,添加新列(sepal_by_petal):
my_data %>%
transmute(
sepal_by_petal_l = Sepal.Length/Petal.Length,
sepal_by_petal_w = Sepal.Width/Petal.Width
)
- 一次修改多个列
函数mutate_all()/ transmutate_all(),mutate_at()/ transmutate_at()和mutate_if()/ transmutate_if()可用于一次修改多个列。
简化格式如下:
# Mutate variants
mutate_all(.tbl, .funs, ...)
mutate_if(.tbl, .predicate, .funs, ...)
mutate_at(.tbl, .vars, .funs, ...)
# Transmutate variants
transmute_all(.tbl, .funs, ...)
transmute_if(.tbl, .predicate, .funs, ...)
transmute_at(.tbl, .vars, .funs, ...)
tbl:一个tbl数据框
funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。 选择predicate为或返回TRUE的变量。
- 转换特定列
mutate_at():转换按名称选择的特定列:
my_data2 %>%
mutate_at(
c("Sepal.Length", "Petal.Width"),
funs(cm = ./2.54)
)
- mutate_if():转换由谓词函数选择的特定列。
- mutate_if()对于将变量从一种类型转换为另一种类型特别有用。
# 将所有因子列转化成字符
my_data %>% mutate_if(is.factor, as.character)
# 将左右数字列四舍五入
my_data %>% mutate_if(is.numeric, round, digits = 0)
网友评论