美文网首页
2021-05-24 分组统计——group.by & summ

2021-05-24 分组统计——group.by & summ

作者: NAome | 来源:发表于2021-05-24 23:35 被阅读0次

    group.by——分组函数;summarise()——汇总统计函数

    group.by()按给定的列中的元素分组,而summarise()则用于对指定变量进行汇总统计,在与group.by()联用时,可以进行分组汇总统计。

    library(dplyr)
    library(tidyverse) #tidyverse是一个汇总包,其中包括了dplyr
    
    
    #按照Species中的类型进行分组,分别统计Petal.Legth的均值,方差,最小值,最大值,以及数目
    iris %>% as_tibble() %>% 
      group_by(Species) %>%
      summarise(avg_pet_len = mean(Petal.Length),
                sd_pet_len = sd(Petal.Length),
                min_pet_len = min(Petal.Length),
                max_pet_len = max(Petal.Length),
                n_pet_len = n())
    

    常用函数:

    Center 位置度量 : mean(), median()
    Spread 分散程度度量 : sd(), IQR(), mad()
    Range 秩的度量 : min(), max(), quantile()
    Position 定位度量 : first(), last(), nth(),
    Count 计数 : n(), n_distinct(),其中n() :无需参数返回当前分组的大小
    Logical 逻辑值的计数和比例 : any(), all()

    相关文章

      网友评论

          本文标题:2021-05-24 分组统计——group.by & summ

          本文链接:https://www.haomeiwen.com/subject/xxofsltx.html