美文网首页生信星球培训第四十五期
学习小组Day--6笔记--丁览博

学习小组Day--6笔记--丁览博

作者: 丁览博 | 来源:发表于2020-03-21 17:26 被阅读0次

学习R包

day6 思维导图

图片来自于ipad OS端mindnode

学习与加载R包

设置镜像-安装-加载三联

options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

dplyr五个基本函数

示例数据:test <- iris[c(1:2,51:52,101:102),]

  1. 新增列


    mutae
  1. 筛选列
  • 按列号筛选


    select num
  • 按列名筛选


    select name
  1. 筛选行


  1. 对表格排序
  • 默认从小到大排序
    arrange(test,colname)
  • 从大到小排序
    arrange(test,desc(colname))
  1. 汇总
  • 计算均值和标准差
    summarise(test,mean(colname 1),sd(colname 2))
  • 先分组在计算
    summarise(group_by(test,colname 0),mean(colname 1),sd(colname 2))

dplyr两个实用节能

  1. 管道操作(ctrl+shift+m ==》%>%)
> test %>% 
+ group_by(Species) %>% 
+ summarise(mean(Sepal.Length),sd(Petal.Width)) 

2.统计某列的unique值
count(test,colname)

dplyr处理关系数据

  1. 内连取交集
> inner_join(test1,test2,by='x')
  x z y
1 b A 2
2 e B 5
3 f C 6
  1. 左连
> left_join(test1,test2,by='x')
  x z  y
1 b A  2
2 e B  5
3 f C  6
4 x D NA
> left_join(test2,test1,by='x')
  x y    z
1 a 1 <NA>
2 b 2    A
3 c 3 <NA>
4 d 4 <NA>
5 e 5    B
6 f 6    C
  1. 全连
> full_join(test1,test2,by='x')
  x    z  y
1 b    A  2
2 e    B  5
3 f    C  6
4 x    D NA
5 a <NA>  1
6 c <NA>  3
7 d <NA>  4
  1. 半连接

  2. 反连接

  3. 简单合并

  • 合并行:bind_rows(test1,test2)
  • 合并列:bind_cols(test1,test2)
> bind_rows(test1,test2)
  x  y
1 1 10
2 2 20
3 3 30
4 4 40
5 5 50
6 6 60
> bind_cols(test1,test3)
  x  y   z
1 1 10 100
2 2 20 200
3 3 30 300
4 4 40 400

相关文章

网友评论

    本文标题:学习小组Day--6笔记--丁览博

    本文链接:https://www.haomeiwen.com/subject/mgquyhtx.html