美文网首页生信星球培训第107期
《学习小组Day6笔记--范若辰》

《学习小组Day6笔记--范若辰》

作者: 饭艾雨 | 来源:发表于2021-05-01 23:47 被阅读0次
    • 一.配置RStudio下载镜像

      • 1.Tools-->Global options-->Packages-->Primary CRANrepository-->China(Beijing)...

        • 输入命令options()$验证
      • 2.输入命令:
        options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
        添加镜像

        • 输入命令options()$BioC_mirror查询
      • 3.编辑.Rprofile配置文件

        • 输入命令:file.edit('~/.Rprofile')

        • 添加代码:
          options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")

        • 保存重启后输入options()$repos和options()$BioC_mirror进行验证和options()$BioC_mirror进行验证

    • 二.安装R包

      • 安装命令:

        • 1.install.packages:安装的包存在于CRAN网站

        • 2.BiocManager::install:安装的包存在于Biocductor

        • 3.安装BioConductor

          • 输入library("BiocVersion")等命令检查是否安装过BioConductor

          • 安装命令;

            • install.packages("BiocManager")

            • BiocManager::install()

          • 升级BioConducor及相关软件包

            • 先卸载当前的安装程序:remove.packages(c("BiocInstaller", "BiocManager", "BiocVersion"))

            • 再次安装新版本:

            • install.packages("BiocManager")

            • BiocManager::install(update=TRUE, ask=FALSE)

          • 使用旧版软件:BiocManager::install(version="版本号")

      • 安装加载命令

        • 以安装dplyr为例

          • options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))

          • options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")

          • install.packages("dplyr")

          • library(dplyr)

    • 三.dplyr包的应用

      • 1.mutate(),新增列


        新增一列new,数值为SepalLength 与SepalWidth的乘积.png
      • 2.select(),按列筛选

        • (1)按列号筛选


          选择第一列&选择第一列和第五列.png
        • (2)按列名筛选


          选择对应的列,将保存至变量vars中.png
      • 3.filter()筛选行


        筛选Species为setosa与versicolor的行.png
        筛选Species为setosa对应的行;筛选Species为setosa对应且SepalLength数值大于5的行.png
      • 4.arrange(),按某1列或某几列对整个表格进行排序


        arrange排序默认从小到大排序,输入参数desc后按照从大到小排序.png
      • 5.summarise():汇总


        mean计算平均值sd计算标准差.png
    按照Species进行分组.png 按照每一物种计算平均值(Sepal.Length)与标准差(Sepal.Length).png

    6.管道操作 %>% (cmd/ctr + shift + M)

    同Linux管道操作,将前面得到的数据作为标准输入


    管道操作;按照每一物种计算评价年至(Sepal.Length)与标准差(Sepal.Length).png

    7.count统计某列的unique值


    通过count统计某一列不同数据的重复次数.png

    8.将2个表进行连接

    1.內连inner_join,取交集

    2.左连left_join

    3.全连full_join

    4.半连接:返回能够与y表匹配的x表所有记录semi_join

    5.反连接:返回无法与y表匹配的x表的所记录anti_join

    6.简单合并 思维导图.png 学习大纲.png

    相关文章

      网友评论

        本文标题:《学习小组Day6笔记--范若辰》

        本文链接:https://www.haomeiwen.com/subject/shgzrltx.html