学习小组Day6笔记

作者: 7523_68db | 来源:发表于2020-03-11 22:00 被阅读0次

    什么是R包?
    R包是多个函数的集合,具有详细的说明和示例。不同的R包具有不同的功能。

    R包的安装
    install.packages(“包”)——要安装的包存在于CRAN网站
    BiocManager::install(“包”)——要安装的包存在于Biocductor
    R包的加载
    由于并不是说安装R包后就能直接使用,因为R语言中涉及到很多的R包,如果全是自动加载,就会导致混乱,因此,当需要什么类型的包时,临时加载即可。加载R包的命令如下:

    library(包名)
    或者
    require(包名)
    

    R包的安装加载三部曲(以dplyr包为例)

    options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
    install.packages("dplyr", destdir = “E:/R/RStudiowork/downloaded_packages”#更改R包下载路径))
    library(dplyr)
    

    R包的使用

    dplyr的使用

    利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境.
    运行R包需要一定的数据

    test <- iris[c(1:2,51:52,101:102),]
    

    1.mutate(),新增列

    Snipaste_2020-03-11_21-03-47.png

    2.select(),按列筛选
    select()用列名作参数来选择子数据集。dplyr包中提供了些特殊功能的函数与select函数结合使用, 用于筛选变量,包括starts_with,ends_with,contains,matches,one_of,num_range和everything等。
    语法 : select(.data, ...)
    可以是列数或者是列名

    Snipaste_2020-03-11_21-18-24.png
    Snipaste_2020-03-11_21-20-00.png

    3.filter()筛选行

    Snipaste_2020-03-11_21-26-57.png
    4.arrange(),按某1列或某几列对整个表格进行排序(注意大小写)
    Snipaste_2020-03-11_21-33-10.png
    Snipaste_2020-03-11_21-34-27.png
    5.summarise():汇总
    Snipaste_2020-03-11_21-39-44.png

    dplyr两个实用技能

    1:管道操作 %>% (cmd/ctr + shift + M)
    以上函数都是单独使用,通过使用管道操作符将 dplyr 变形函数连接起来。

    Snipaste_2020-03-11_21-47-23.png
    如此处加上管道操作就可以将group和summerize函数联合使用。

    count统计某列的unique值

    Snipaste_2020-03-11_21-50-26.png

    dplyr处理关系数据

    也就是将两个表连接到一起


    Snipaste_2020-03-11_21-55-50.png

    相关文章

      网友评论

        本文标题:学习小组Day6笔记

        本文链接:https://www.haomeiwen.com/subject/tjwhjhtx.html