学习R包
- R包都有自己的说明书(cheatsheet),俗称小抄。
获取R包小抄的方法
- 百度XX小抄
- 找Rstudio的cheatsheet网站(网速好慢的)cheatsheet
- 生信星球公众号回复相应的包名获取
初步了解tidyr
- 主要功能
- 数据框的变形 2. 处理数据的空值 3. 根据一个表格衍生出其他表格 4. 实现行或者列的分割
install.packages("tidyr")#安装
library(tidyr) #载入
- 新建一个数据框
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
rep,重复,括号中填要重复的字符和重复次数。
paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。
函数后面一般都要加括号,括号里第一个参数是都数据框名
字符串要加双引号
行 raw, 列 column,简化写法为col
创建一个练习数据
图片.pnggather(a,`hai`,`dou`,key = "name",value = "case")#正规用法
gather(a,"name","case",hai,dou)#懒人用法
图片.png
gather括号里的分别是:数据框名,需合并的列名(两个),合并后的key列名,value列名。
处理缺失值
- 删除整行
- 根据上下文(瞎)蒙一个
- 同一列的空值填上同一个数
X <- data.frame(x1=c("A","B","C","D","E"),x2=c(1,NA,NA,3,NA))
X
View(X)
drop_na(X,x2)
?drop_na
fill(X,x2)
X
replace_na(X,list(x2=2))
图片.png
pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
View(pin2)
expand(pin2,GeneId,SampleName,Expression)
base```
- expand三列排列组合
网友评论