美文网首页生信星球培训第八期
学习小组Day6笔记——四海

学习小组Day6笔记——四海

作者: 寂静之巅 | 来源:发表于2018-10-27 22:43 被阅读56次

学习R包

  • R包都有自己的说明书(cheatsheet),俗称小抄。
获取R包小抄的方法
  • 百度XX小抄
  • 找Rstudio的cheatsheet网站(网速好慢的)cheatsheet
  • 生信星球公众号回复相应的包名获取
初步了解tidyr
  • 主要功能
  1. 数据框的变形 2. 处理数据的空值 3. 根据一个表格衍生出其他表格 4. 实现行或者列的分割
install.packages("tidyr")#安装
library(tidyr) #载入
  • 新建一个数据框
    a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))

rep,重复,括号中填要重复的字符和重复次数。
paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。
函数后面一般都要加括号,括号里第一个参数是都数据框名
字符串要加双引号
行 raw, 列 column,简化写法为col

创建一个练习数据

图片.png
gather(a,`hai`,`dou`,key = "name",value = "case")#正规用法
gather(a,"name","case",hai,dou)#懒人用法
图片.png

gather括号里的分别是:数据框名,需合并的列名(两个),合并后的key列名,value列名。

处理缺失值

  • 删除整行
  • 根据上下文(瞎)蒙一个
  • 同一列的空值填上同一个数
X <- data.frame(x1=c("A","B","C","D","E"),x2=c(1,NA,NA,3,NA))
X
View(X)
drop_na(X,x2)
?drop_na
fill(X,x2)
X
replace_na(X,list(x2=2))
图片.png
pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
View(pin2)
expand(pin2,GeneId,SampleName,Expression)
base```
- expand三列排列组合

相关文章

网友评论

    本文标题:学习小组Day6笔记——四海

    本文链接:https://www.haomeiwen.com/subject/kvljtqtx.html