周末就是干杂活………房子装修……电车修理……看材料……反正就是没有学习。周日补周六的作业。昨天已经通过公众号下载tidyr,作用:数据框的变形;处理数据框中的空值;根据一个表格衍生出其他表格;实现行或列的分割和合并。反正现在还没有明白,先记下往下看。
1.建立Excel表格,即数据框:命令为(此处赋值a,也可以改成其他的):a<-data.frame(GeneId=rep("gene5",times=3),SampleName=paste("Sample",1:3,sep=""),Expression=c(14,19,18))(rep代表重复,需填重复的内容及次数;paste代表链接两个字符串,需填连接字符和分隔符(sep),sep""表示无分隔符;Expression代表值。)
注意:括号里第一个参数是都数据框名,字符串加双引号。
行=row;列=column=col
2.认识Tidy Data
让我试试可否写出来和教程一样的数据框
然而并没有成功
3.Reshape Data
gather和spread
3.1根据别人的笔记写……没有怎么看懂小抄啊……
2.png 3.png
试试gather,然而一直报错
4.png
我先缓缓……
gather括号里的分别是:
数据框名,需合并的列名(两个),合并后的key列名,value列名。
5.png
3.2 处理丢失的数据
新建一个doudou.txt-设置工作目录-导入表格:X<-read.csv('doudou.txt')--- 6.png 7.png
注意:csv支持txt和R
library(tidyr)后才能用教程里的命令
1.png 2.png
1.png
重新补处理丢失数据
1.png
1.png 1-1.png 2.png 2-1.png
3.3 Expand和complete
1.png 1-1.png
1.png 1-1.png
1.png
网友评论