1、R包的说明书(cheatsheet)
获取方法:百度或谷歌
https://www.rstudio.com/resources/cheatsheets/
生信星球
2、tidyr的作用
(1)数据框变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
就是把数据处理成标准而统一的数据框(Tidy Data),才能进行进一步的数据处理和作图。
3、下载和安装tidyr
install.packages("tidry")





4、新建数据框
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))


实在是没时间了,今天一天都在加班,明天一上午也要加班,只能先把主要内容写下,后面再逐一操作了。
rep,重复
paste,连接两个字符串,
行 raw
列 column,简化写法为col
5、Reshape Data
TidyData:提供了一种能够跨包使用的“统一”的数据格式
gather
spread
6、Handle Missing Values
三种处理方式:
(1).删除整行
(2).根据上下文猜一个
(3).同一列的空值填上同一个数。
导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行删除掉
fill(),根据上一行的数值填充上
replace_na(),空值填进去特定的一个数值
7、 Expand Tables
complete(把空值的位置补全)
8、split cells
把一列拆成两列。原列要有分隔符才行。
separate:按列分割
separate_rows:按行分割
unite:分割完了再合并回去

网友评论