group.by——分组函数;summarise()——汇总统计函数
group.by()按给定的列中的元素分组,而summarise()则用于对指定变量进行汇总统计,在与group.by()联用时,可以进行分组汇总统计。
library(dplyr)
library(tidyverse) #tidyverse是一个汇总包,其中包括了dplyr
#按照Species中的类型进行分组,分别统计Petal.Legth的均值,方差,最小值,最大值,以及数目
iris %>% as_tibble() %>%
group_by(Species) %>%
summarise(avg_pet_len = mean(Petal.Length),
sd_pet_len = sd(Petal.Length),
min_pet_len = min(Petal.Length),
max_pet_len = max(Petal.Length),
n_pet_len = n())
常用函数:
Center 位置度量 : mean(), median()
Spread 分散程度度量 : sd(), IQR(), mad()
Range 秩的度量 : min(), max(), quantile()
Position 定位度量 : first(), last(), nth(),
Count 计数 : n(), n_distinct(),其中n() :无需参数返回当前分组的大小
Logical 逻辑值的计数和比例 : any(), all()
网友评论