初识R语言—分组数据处理

作者: 超级无敌大蜗牛 | 来源:发表于2020-04-02 22:49 被阅读0次

初识R语言—分组数据处理
01_2_差异表达分析实操
R语言第二章数据处理④数据框排序和重命名
R语言第二章数据处理⑤数据框列的转化和计算
R语言第二章数据处理⑦dplyr包（2）列处理
R语言第二章数据处理⑥dplyr包（1）列选取
R语言第二章数据处理⑨缺失值判断和填充
R语言第二章数据处理⑧数据采样和离散化
R语言第二章数据处理(9)数据合并
R语言第二章数据处理③删除重复数据

#用list函数将list里面的向量和income一一对应进行计算
#创建数据集df1
> age <- c(18,19,23,14,15)
> sex <- c('F','M','F','F','M')
> income <- c(2000,3000,5500,4300,1900)
> education <- c("高中","初中","高中","博士","初中")
> df1 <- data.frame(age,sex,income,education)
> df1
  age sex income education
1  18   F   2000      高中
2  19   M   3000      初中
3  23   F   5500      高中
4  14   F   4300      博士
5  15   M   1900      初中
 #需求1:想知道男女各自收入总和
#需求2:想知道不同性别不同学历的人群的平均收入

tapply(vector, INDEX, FUN)
vector:要计算的变量
INDEX:分组变量
FUN:函数

> tapply(df1$income,df1$sex,sum)
    F     M 
11800  4900 
> tapply(df1$income,list(df1$sex,df1$education),mean)
  初中 博士 高中
F   NA 4300 3750
M 2450   NA   NA

by(data, INDEX,FUN)
data:要计算的变量
INDEX: 分组变量
FUN: 函数

#by函数
> by(df1$income,df1$sex,sum)
df1$sex: F
[1] 11800
-------------------------------------------------------- 
df1$sex: M
[1] 4900
> by(df1$income,list(df1$sex,df1$education),mean)
: F
: 初中
[1] NA
-------------------------------------------------------- 
: M
: 初中
[1] 2450
-------------------------------------------------------- 
: F
: 博士
[1] 4300
-------------------------------------------------------- 
: M
: 博士
[1] NA
-------------------------------------------------------- 
: F
: 高中
[1] 3750
-------------------------------------------------------- 
: M
: 高中
[1] NA

aggregate(x~x1+x2+..., data, FUN)
x要计算的变量
x1,x2...：分组变量x1，x2...
data：数据集
FUN:函数

> #aggregate函数
> aggregate(income~sex,df1,sum)
  sex income
1   F  11800
2   M   4900
> aggregate(income~sex+education,df1,sum)
  sex education income
1   M      初中   4900
2   F      博士   4300
3   F      高中   7500

总结：推荐aggregate

网友评论

本文标题：初识R语言—分组数据处理

本文链接：https://www.haomeiwen.com/subject/qdcqphtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

初识R语言—分组数据处理

相关文章

初识R语言—分组数据处理

01_2_差异表达分析实操

R语言第二章数据处理④数据框排序和重命名

R语言第二章数据处理⑤数据框列的转化和计算

R语言第二章数据处理⑦dplyr包（2）列处理

R语言第二章数据处理⑥dplyr包（1）列选取

R语言第二章数据处理⑨缺失值判断和填充

R语言第二章数据处理⑧数据采样和离散化

R语言第二章数据处理(9)数据合并

R语言第二章数据处理③删除重复数据

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读