apply函数族
R函数的诸多有趣特性之一,就是它们可以应用到一系列的数据对象上,包括标量、向量、矩阵、数组、数据框和列表。将函数应用于不同的数据对象,主要是借助apply函数族来实现的,该函数族内的函数有apply()、lapply()等多个函数,各个函数的功能相似,需要注意的是,各函数的使用对象和返回结果的形式存在一定的差异,详见下表。
apply函数族中的常用函数下面分别介绍各个函数的使用。
(1)apply()
·功能:对数组或者矩阵的一个维度使用函数生成列表或者数组、向量。
·使用格式:
apply(x,MARGIN,FUN,…)
其中,x为数据对象,可以是矩阵、数组或者数据框,MARGIN=1表示矩阵行,2表示矩阵列,也可以是c(1,2),FUN表示使用的函数。
·实例:计算矩阵x各行各列的均值。
使用apply函数计算矩阵的均值
>x<-matrix(1:20,ncol=4)
> x
[,1] [,2] [,3] [,4]
[1,] 1 6 11 16
[2,] 2 7 12 17
[3,] 3 8 13 18
[4,] 4 9 14 19
[5,] 5 10 15 20
> apply(x,1,mean) #计算各行的均值
[1] 8.5 9.5 10.5 11.5 12.5
> apply(x,2,mean) #计算各列的均值
[1] 3 8 13 18
(2)lapply()
·功能:对x的每一个元素运用函数,生成一个与元素个数相同的值列表。
·使用格式:
lapply(x,FUN,…)
其中,x为数据对象,可以是列表、数据框或者向量,FUN表示使用的函数。
·实例:对列表x的每一个元素计算均值。
使用lapply函数计算各子列表的均值
> x <- list(a = 1:5, b = exp(0:3))
> x
$a
[1] 1 2 3 4 5
$b
[1] 1.000000 2.718282 7.389056 20.085537
> lapply(x,mean) #对列表x的每一个元素计算均值
$a
[1] 3
$b
[1] 7.798219
(3)sapply()
·功能:通过对x的每一个元素运用函数,生成一个与元素个数相同的值列表或矩阵。
·使用格式:
sapply(x,FUN,…,simplify=TRUE, USE.NAMES = TRUE)
sapply函数比lapply函数多了一个simplify参数。如果simplify=FALSE,则等价于lapply,否则将lapply输出的list简化为vector或matrix。
·实例:列表list中的元素与数字1~3连接,并以矩阵和列表两种形式输出。
使用sapply函数处理列表的字符串连接
> list=list(c("a", "b", "c"),c("A", "B", "C"))
> list
[[1]]
[1] "a" "b" "c"
[[2]]
[1] "A" "B" "C"
列表list中的元素与数字1~3连接,输出结果为矩阵
> sapply(list, paste,1:3, simplify=TRUE)
[,1] [,2]
[1,] "a 1" "A 1"
[2,] "b 2" "B 2"
[3,] "c 3" "C 3"
#列表list中的元素与数字1~3连接,输出结果为列表
> sapply(list, paste,1:3 ,simplify=F)
[[1]]
[1] "a 1" "b 2" "c 3"
[[2]]
[1] "A 1" "B 2" "C 3"
(4)tapply()
·功能:对不规则阵列使用向量,即对一组非空值按照一组确定因子进行相应计算。
·使用格式:
tapply(x, INDEX, FUN, …, simplify = TRUE)
其中,x通常是一个向量。INDEX是因子列表,和x长度一样。simplify是逻辑变量,若取值为TRUE(默认值),且函数FUN的计算结果总是为一个标量值,那么函数tapply返回一个数组;若取值为FALSE,则函数tapply的返回值为一个list对象。需要注意的是,当第二个参数INDEX不是因子时,函数tapply()同样有效,因为必要时,R会用as.factor()把参数强制转换成因子。
·实例:计算不同sex对应的height的均值。
使用tapply函数进行分组统计
> height <- c(174, 165, 180, 171, 160)
> sex<-c("F","F","M","F","M")
> tapply(height, sex, mean) #计算不同sex对应的height的均值
F M
170 170
(5)mapply()
mapply()函数是sapply的多变量版本。将对多个变量的每个参数运行FUN函数,如有必要,参数将被循环。
·使用格式:
mapply(FUN,…,MoreArgs=NULL,SIMPLIFY=TRUE,USE.NAMES=TRUE)
其中,MoreArgs为FUN函数的其他参数列表。SIMPLIFY是逻辑或者字符串,取值为TRUE时,将结果转换为一个向量、矩阵或者更高维阵列,但不是所有结果都能够转换。
·实例:使用mapply函数重复生成列表list(x=1:2))。
使用mapply函数重复生成列表
#重复生成列表list(x = 1:2)),重复次数times=1:3,结果为一个列表
> mapply(rep, times = 1:3, MoreArgs = list(x = 1:2))
[[1]]
[1] 1 2
[[2]]
[1] 1 2 1 2
[[3]]
[1] 1 2 1 2 1 2
#重复生成列表list(x = 1:2)),重复次数times=c(2,2),结果为一个矩阵
> mapply(rep, times = c(2,2), MoreArgs = list(x = 1:2))
[,1] [,2]
[1,] 1 1
[2,] 2 2
[3,] 1 1
[4,] 2 2
网友评论