美文网首页ggplot集锦
[Rtips] group_by + across + wher

[Rtips] group_by + across + wher

作者: 热衷组培的二货潜 | 来源:发表于2020-12-07 23:26 被阅读0次

来源群里一个老哥问:

data_ori<-"CB;IB;NCB;tag
combine=0;0;2;6;a
combine=1;3;3;5;b
combine=2;8;6;2;b"
data<- read.table(text = data_ori,header = T,sep=";",quote ="")

haha<-data.frame(c("a","b"))
colnames(haha)<-"tag"
for (i in c("CB","IB","NCB")){
  ll<- data  %>% select(i,tag) %>% group_by(tag) %>%  summarise(tmp = sum(data[,i]))
  colnames(ll)<-c("tag",i)
  haha<-haha %>% left_join(ll,by="tag")
}想以tag为组求和,而不是要该列全部的和,求问改怎么改呀


想要的是比如CB列,a组的和是0,b组的和是1;IB列a组和为2,b组和为9

变成


作为常年在网上各种群摸鱼的我,有时候只要不是很忙或者说心情还好,就会去解答,但是想着解答了后不记录下来,那么看到答案的人就少了。所以就有了我此文。

有两种方法:

第一种:

如果看不懂下面代码,建议大家认证去学习一下 dplyr 1.0 后增加的 acrosswhere 系列内容。
相关内容可在 tidyverse 官方阅读:
https://www.tidyverse.org/blog/
dplyr 1.0.0: working across columns

# 最简单粗暴

library(tidyverse)
data %>%
  group_by(tag) %>%
  summarise(across(where(is.numeric), sum))

`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 2 x 4
  tag      CB    IB   NCB
  <chr> <int> <int> <int>
1 a         0     2     6
2 b        11     9     7

第二种:


# 第二种:比较啰嗦

library(tidyverse)

data %>%
  pivot_longer(
    cols = -tag,
    names_to = "group",
    values_to = "value"
  ) %>%
  group_by(tag, group) %>%
  summarise(tmp = sum(value)) %>%
  ungroup() %>%
  pivot_wider(
    names_from = group,
    values_from = tmp
    )

`summarise()` regrouping output by 'tag' (override with `.groups` argument)
# A tibble: 2 x 4
  tag      CB    IB   NCB
  <chr> <int> <int> <int>
1 a         0     2     6
2 b        11     9     7

相关文章

网友评论

    本文标题:[Rtips] group_by + across + wher

    本文链接:https://www.haomeiwen.com/subject/uhvxgktx.html