dplyr包

作者: 801ca16edefa | 来源:发表于2022-03-07 15:14 被阅读0次

    1. dplyr简介

    dplyr是R语言的数据分析包,能对dataframe类型的数据做很方便的数据处理和分析操作。d代表dataframe - plyr是英文钳子plier的谐音.

    dplyr如同R的大多数包,都是函数式编程。有点类似于流水线,每个函数就是一个车间,多个车间共同完成一个生产(数据分析)任务。

    而在dplyr中,就有一个管道符 %>% ,符号左侧表示数据的输入,右侧表示下游数据处理环节。

    dplyr是R中专门用于数据处理的包。更具体功能包括:

    •select() 从数据中选择列

    •filter() 数据行的子集

    •group_by()汇总数据

    •summarise()汇总数据(计算汇总统计信息)

    •arrange() 排序数据

    mutate() 创建新变量

    2. dplyr常用函数

    2.1 arrange


    也可以写成下面的形式: aapl %>% arrange(-Volume)

    2.2 Select

    排除3列 aapl %>% select(-c("Open", "High", "Low"))

    2.3 Filter

    aapl %>% filter((Close>=150) & (Close>Open))

    2.4 Mutate(重点)

    aapl %>% mutate(n=row_number())

    注:转自知乎(HiDadeng)

    相关文章

      网友评论

          本文标题:dplyr包

          本文链接:https://www.haomeiwen.com/subject/lbcadctx.html