R : apply函数族

作者: 11的雾 | 来源:发表于2019-11-18 16:21 被阅读0次

    apply函数族

    R函数的诸多有趣特性之一,就是它们可以应用到一系列的数据对象上,包括标量、向量、矩阵、数组、数据框和列表。将函数应用于不同的数据对象,主要是借助apply函数族来实现的,该函数族内的函数有apply()、lapply()等多个函数,各个函数的功能相似,需要注意的是,各函数的使用对象和返回结果的形式存在一定的差异,详见下表。

    apply函数族中的常用函数

    下面分别介绍各个函数的使用。

    (1)apply()

    ·功能:对数组或者矩阵的一个维度使用函数生成列表或者数组、向量。

    ·使用格式:
    apply(x,MARGIN,FUN,…)
    其中,x为数据对象,可以是矩阵、数组或者数据框,MARGIN=1表示矩阵行,2表示矩阵列,也可以是c(1,2),FUN表示使用的函数。

    ·实例:计算矩阵x各行各列的均值。

    使用apply函数计算矩阵的均值

    >x<-matrix(1:20,ncol=4)
    > x
            [,1]  [,2]  [,3]  [,4]
    [1,]     1     6     11    16
    [2,]     2     7     12    17
    [3,]     3     8     13    18
    [4,]     4     9     14    19
    [5,]     5     10    15    20
    
    > apply(x,1,mean) #计算各行的均值
    [1] 8.5  9.5  10.5  11.5  12.5
    
    > apply(x,2,mean) #计算各列的均值
    [1] 3  8  13  18
    

    (2)lapply()

    ·功能:对x的每一个元素运用函数,生成一个与元素个数相同的值列表。
    ·使用格式:
    lapply(x,FUN,…)

    其中,x为数据对象,可以是列表、数据框或者向量,FUN表示使用的函数。

    ·实例:对列表x的每一个元素计算均值。

    使用lapply函数计算各子列表的均值

    > x <- list(a = 1:5, b = exp(0:3))
    > x
    $a
    [1] 1  2  3  4  5
    $b
    [1]  1.000000  2.718282  7.389056  20.085537
    
    > lapply(x,mean) #对列表x的每一个元素计算均值
    $a
    [1] 3
    $b
    [1] 7.798219
    

    (3)sapply()

    ·功能:通过对x的每一个元素运用函数,生成一个与元素个数相同的值列表或矩阵。

    ·使用格式:

    sapply(x,FUN,…,simplify=TRUE, USE.NAMES = TRUE)

    sapply函数比lapply函数多了一个simplify参数。如果simplify=FALSE,则等价于lapply,否则将lapply输出的list简化为vector或matrix。

    ·实例:列表list中的元素与数字1~3连接,并以矩阵和列表两种形式输出。

    使用sapply函数处理列表的字符串连接

    > list=list(c("a", "b", "c"),c("A", "B", "C"))
    > list
    [[1]]
    [1] "a"  "b"  "c"
    [[2]]
    [1] "A"  "B"  "C"
    

    列表list中的元素与数字1~3连接,输出结果为矩阵

    > sapply(list, paste,1:3, simplify=TRUE)
        [,1]   [,2]
    [1,] "a 1"  "A 1"
    [2,] "b 2"  "B 2"
    [3,] "c 3"  "C 3"
    
    #列表list中的元素与数字1~3连接,输出结果为列表
    > sapply(list, paste,1:3 ,simplify=F)
    [[1]]
    [1] "a 1"  "b 2"   "c 3"
    [[2]]
    [1] "A 1"  "B 2"  "C 3"
    

    (4)tapply()

    ·功能:对不规则阵列使用向量,即对一组非空值按照一组确定因子进行相应计算。

    ·使用格式:

    tapply(x, INDEX, FUN, …, simplify = TRUE)

    其中,x通常是一个向量。INDEX是因子列表,和x长度一样。simplify是逻辑变量,若取值为TRUE(默认值),且函数FUN的计算结果总是为一个标量值,那么函数tapply返回一个数组;若取值为FALSE,则函数tapply的返回值为一个list对象。需要注意的是,当第二个参数INDEX不是因子时,函数tapply()同样有效,因为必要时,R会用as.factor()把参数强制转换成因子。

    ·实例:计算不同sex对应的height的均值。

    使用tapply函数进行分组统计

    > height <- c(174, 165, 180, 171, 160)
    > sex<-c("F","F","M","F","M")
    > tapply(height, sex, mean) #计算不同sex对应的height的均值
        F   M
    170  170
    

    (5)mapply()

    mapply()函数是sapply的多变量版本。将对多个变量的每个参数运行FUN函数,如有必要,参数将被循环。

    ·使用格式:

    mapply(FUN,…,MoreArgs=NULL,SIMPLIFY=TRUE,USE.NAMES=TRUE)

    其中,MoreArgs为FUN函数的其他参数列表。SIMPLIFY是逻辑或者字符串,取值为TRUE时,将结果转换为一个向量、矩阵或者更高维阵列,但不是所有结果都能够转换。

    ·实例:使用mapply函数重复生成列表list(x=1:2))。

    使用mapply函数重复生成列表

    #重复生成列表list(x = 1:2)),重复次数times=1:3,结果为一个列表
    > mapply(rep, times = 1:3, MoreArgs = list(x = 1:2))
    [[1]]
    [1]  1  2
    [[2]]
    [1]  1  2  1  2
    [[3]]
    [1]  1  2  1  2  1  2
    
    #重复生成列表list(x = 1:2)),重复次数times=c(2,2),结果为一个矩阵
    > mapply(rep, times = c(2,2), MoreArgs = list(x = 1:2))
            [,1]  [,2]
    [1,]      1     1
    [2,]      2     2
    [3,]      1     1
    [4,]      2     2
    

    相关文章

      网友评论

        本文标题:R : apply函数族

        本文链接:https://www.haomeiwen.com/subject/hejbictx.html