美文网首页
把pdata的多余列去掉

把pdata的多余列去掉

作者: 小洁忘了怎么分身 | 来源:发表于2019-02-20 19:40 被阅读89次

    GEO数据分析中用到pdata表格,为了从中找出分组信息,可谓非常费眼睛。有的表格友好一点,十几列。有的夸张起来六十页不成问题。
    所以我搞定了一个函数,取名small,把多余的列(即所有行都相同的列)去掉,起到缩小表格的作用。
    可以用你的pdata表格试试,也可以在生信星球公众号回复“pd”获取示例数据pd.Rdata

    load(file="pd.Rdata")
    small <- function(df){
      library(tibble)
      library(dplyr)
      colname <- vector("character")
      count <- vector("integer")
      for(i in 1:ncol(df)){
        colname[i] = colnames(df)[[i]]
        count[i]=nrow(df[!duplicated(df[,i]),])
      }
      o <- tibble(colname,count) 
      output=df[,o$count>1]
    }
    pd=small(pd)
    

    以我的示例数据为例,从34列变成了5列。

    相关文章

      网友评论

          本文标题:把pdata的多余列去掉

          本文链接:https://www.haomeiwen.com/subject/dllkyqtx.html