美文网首页ggplot集锦
R数据分组且合并重复的列

R数据分组且合并重复的列

作者: 生信云笔记 | 来源:发表于2020-07-19 11:01 被阅读0次

在用R语言做数据处理时,通常使用的数据类型是数据框(可类比于excel表格,这样脑海中会有一个直观的印象)。那么数据清理过程中就会需要做各种变化和统计,比如按某些变量来分组并合并重复的数据,那么这个小的需求该如何实现呢?下面我们看看如何来实现这个要求。

#例如现有数据框df格式如下:
name group  num  color  id
test1  g1  2  blue  1
test2  g2  3   red  2
test2  g2  3  red  5
test3  g3  4  yellow  3
test5  g4  5  green  4
#可以看出id列值为2、5的两行前面几列都是一样的,需要合并成如下格式:
name group  num  color  id
test1  g1  2  blue  1
test2  g2  3   red  2,5
test3  g3  4  yellow  3
test5  g4  5  green  4h

对于这个需求我们有两种方法可以完成,一是使用数据清理神奇dplyrR包;二是使用R中基础的分组统计函数aggregate,代码如下:

#方法1
library(dplyr)
df1 <- df %>% group_by(name,group,num,color) %>% summarise(id = paste(id, collapse = ", ")) #可以指定任意分割符

#方法2
df1 <- aggregate(df[5], df[-5], unique)
# 或者
df2 <- aggregate(df[5], df[-5], function(X) paste(unique(X), collapse=", ")) #可以指定任意分割符

现在是不是觉得实现这个需求很简单,你也学会了么?手打文稿不容易,希望各位看官们留下身影帮忙点个赞再走呗!!!

相关文章

  • R数据分组且合并重复的列

    在用R语言做数据处理时,通常使用的数据类型是数据框(可类比于excel表格,这样脑海中会有一个直观的印象)。那么数...

  • R之rbind.fill

    我们总结下R中合并数据框的方法,按列合并cbind()函数,按行合并rbind()函数那么如果对于行列不统一的数据...

  • [R]合并多列数据

    将dataframe中的几列合并为一列总是忘记这个操作,记在这里备忘 额外一句加载超大的tsv.gz数据,可以不用...

  • pandas group分组

    某列数据按照某列分组: 某列数据按照某几列分组: 所有数据按照某列分组: 按照数据类型划分列:

  • java Lambda List集合重复数据获取实现

    Map列表,对其中多个列进行分组,判断重复的实现 指定去重的列 按照指定的列分组 获取重复的key

  • Element-UI el-table多行合并问题

    最终效果 单元格被合并,且鼠标悬浮有变化 数据处理 需要对数据进行处理,按照要合并的列排好序 合并行 合并原理,相...

  • Power Query

    PQ自动批量更新数据 合并/拆分/分组/提取/行列转置/透视/逆透视 添加列/追加查询/合并查询 利用M函数进行P...

  • Python数据处理之合并、去重、分组

    数据合并 数据去重 数据分组

  • EXCLE数据处理学习大全,学会这些就够了!

    1、数据拆分 2、数据合并 3、缺失数据处理 4、重复数据处理 5、数据分组 6、数据标准化 7、加权计算 8、数...

  • R语言数据操作

    列合并 行合并 数据排序 两数据的交集,并集,补集 交集 并集 判断不同 判断是否相同 行名重复解决办法 处理一些...

网友评论

    本文标题:R数据分组且合并重复的列

    本文链接:https://www.haomeiwen.com/subject/twklkktx.html