学习小组Day6-学习R包-CYJ

作者: ButAlways_40e6 | 来源:发表于2020-07-26 11:09 被阅读0次

    R包是多个函数的集合

    1. 安装和加载R包

    1.1 镜像设置

    options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
    options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

    1.2 安装

    install.packages(“包”)
    BiocManager::install(“包”)

    1.3 加载

    library(包)
    require(包)

    安装与加载dplyr包

    options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr") library(dplyr)

    示例数据

    test <- iris[c(1:2,51:52,101:102),]

    2. dplyr五个基础函数

    2.1 mutate(),新增列

    mutate.png

    2.2 select(),按列筛选

    2.2.1 按列号筛选

    select1.png

    2.2.2 按列名筛选

    select2.png

    2.3 filter()筛选行

    filter.png

    2.4 arrange(),按某1列或某几列对整个表格进行排序

    2.4.1 按照Sepal.Length值默认从小到大排序

    arrange1.png

    2.4.2 用desc按照Sepal.Length值从大到小

    arrange2.png

    2.5 summarise():汇总

    对数据进行汇总操作,结合group_by使用实用性强


    summarise.png

    用group_by按照Species分组,分为了3组
    用summarise计算每组Sepal.Length的平均值和标准差

    3. dplyr两个实用技能

    3.1 管道操作 %>% (cmd/ctr + shift + M)

    管道操作.png

    3.2 count统计某列的unique值

    count.png

    4.dplyr处理关系数据

    首先构建2个数据框test1和test2


    test12.png

    4.1 內连inner_join,取交集

    4.2 左连left_join

    按照test1的x列将两个数据库进行合并


    test_join1.png

    按照test2的x列将两个数据库进行合并


    test_join2.png

    4.3 全连full_join

    相当于取两个数据框x的交集进行合并


    full_join.png

    4.4 半连接:返回能够与y表匹配的x表所有记录semi_join

    通过x返回能够与test2表匹配的test1表所有记录


    semi_join.png

    4.5 反连接:返回无法与y表匹配的x表的所记录anti_join

    4.6 简单合并

    image.png
    bind_rows 列数相同行合并
    bind_cols 行数相同列合并

    幕布

    学习R包.png

    相关文章

      网友评论

        本文标题:学习小组Day6-学习R包-CYJ

        本文链接:https://www.haomeiwen.com/subject/lafwlktx.html