GEO数据分析中用到pdata表格,为了从中找出分组信息,可谓非常费眼睛。有的表格友好一点,十几列。有的夸张起来六十页不成问题。
所以我搞定了一个函数,取名small,把多余的列(即所有行都相同的列)去掉,起到缩小表格的作用。
可以用你的pdata表格试试,也可以在生信星球公众号回复“pd”获取示例数据pd.Rdata
load(file="pd.Rdata")
small <- function(df){
library(tibble)
library(dplyr)
colname <- vector("character")
count <- vector("integer")
for(i in 1:ncol(df)){
colname[i] = colnames(df)[[i]]
count[i]=nrow(df[!duplicated(df[,i]),])
}
o <- tibble(colname,count)
output=df[,o$count>1]
}
pd=small(pd)
以我的示例数据为例,从34列变成了5列。
网友评论