美文网首页生信星球培训第八十七期
学习小组DAY6笔记——shoan

学习小组DAY6笔记——shoan

作者: shoan078 | 来源:发表于2020-11-04 19:53 被阅读0次

    R包

    R包的加载

    library(包)
    require(包)
    

    安装+加载

    示例:

    options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
    options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
    install.packages("dplyr")
    library(dplyr)
    

    数据来源:内置数据集iris的简化版

    test <- iris[c(1:2,51:52,101:102),]
    

    dplyr的五个基础函数

    mutate(),新增列

    image.png

    select(),按列筛选

    1. 按列号筛选
    select(test,1)#筛选第一列
    
    image.png
    select(test,c(1,5))#筛选第一列与第五列
    
    image.png
    select(test,Sepal.Length)#筛选Sepal.Length这一列
    
    1. 按列名筛选
    select(test, Petal.Length, Petal.Width)#筛选Petal.Length, Petal.Width两列
    
    image.png
    vars <- c("Petal.Length", "Petal.Width")
    select(test, one_of(vars))#筛选Petal.Length, Petal.Width两列
    
    image.png

    filter()筛选行

    filter(test, Species == "setosa")#筛选为setosa的行
    
    image.png
    filter(test, Species == "setosa"&Sepal.Length > 5 )#筛选setosa且sepal length>5的行
    
    image.png
    filter(test, Species %in% c("setosa","versicolor"))#筛选行为setosa以及versicolor的行
    
    image.png

    arrange(),按某1列或某几列对整个表格进行排序

    arrange(test, Sepal.Length)#默认从小到大排序
    
    image.png
    arrange(test, desc(Sepal.Length))#用desc从大到小
    
    image.png

    .summarise():汇总

    对数据进行汇总操作,结合group_by使用实用性强

    summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差
    
    image.png
    # 先按照Species分组,计算每组Sepal.Length的平均值和标准差
    group_by(test, Species)
    
    image.png
    summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
    
    image.png

    相关文章

      网友评论

        本文标题:学习小组DAY6笔记——shoan

        本文链接:https://www.haomeiwen.com/subject/rzxnvktx.html