1. 数据框的属性
nrow
行,rownames()
行名
ncol
列, colnames()
列名
2. 数据框取子集
① 数据框$列名
按列取子集
df$Gene
②按坐标取子集
df[2,2]#第二行第二列
df[2,]#取第二行
df[,2]#取第二列
df[c(1,3),1:2]#取第一行和第三行的第1-2列
③按名字
df[,"gene]
df[,c("gene","change")]
④按条件
df[df$score>0,]
df$gene[df$score>0]
#只要括号里的和括号外的可以对应起来就行了
3. 数据框修改
df$score <- c(10,20,30,40)#给列名为score这一列修改数值
df$P.value <- c(0.01,0.02,0.03,0.05)#新加入一列P.value
#现有列名就是修改,新出现的列名就是新增
4.去除含有缺失值的行
na.omit(df)
5.两个表格连接
cbind
按列连接
rbind
按行连接
思考Q
图片来自生信技能书.png回答A
load("matchtest.Rdata")
table(x$file_name%in%colnames(y))#x的列名都存在于y中
z=x$file_name[match(colnames(y),x$file_name)]#将序列排成一致的
identical(z,colnames(y))#判断两个变量是否完全一致,TRUE是完全一致,反之则不是
#一句代码分析完成的版本
colnames(y)=x$ID[match(colnames(y),x$file_name)]
网友评论