R批量读取、处理及写出文件

作者: 生信编程日常 | 来源:发表于2020-07-01 23:44 被阅读0次

    在对同一路径下多个文件做相同处理时,可以循环读取文件夹中的文件,批量读取,处理和写入文件,会大大提高工作效率,在R语言中,处理方法如下所示。

    1.批量读取文件

    path <- "~/path/to/your/file/"
    fileNames <- dir(path) 
    filePath <- sapply(fileNames, function(x){ 
      paste(path,x,sep='/')})   
    data <- lapply(filePath, function(x){
      read.csv(x)})  
    

    2.批量处理文件及写出

    上面多个文件被读入到一个叫data的list的文件中,下面可以通过data[[]]来取出每一个文件来进行相同的处理。

    for (i in 1:length(fileNames)){
      temp<-data[[i]]
    write.csv(temp,paste0("../../AllMatrixCountGeneSymbol/",tag,".csv"))
      
    }
    

    下面是对ensembl id注释成gene symbol的例子
    每个需要处理的文件为:



    注释文件:


    for (i in 1:length(fileNames)){
      temp<-data[[i]]
    temp[,1]<-unlist(lapply(as.character(temp[,1]), function(x){strsplit(x, "\\.")[[1]][1]}))
    tag<-unlist(lapply(as.character(colnames(temp)[1]), function(x){strsplit(x, "\\id_")[[1]][2]}))
    
    colnames(temp)[1]<-"ENSEMBL"
    temp<-aggregate(.~ENSEMBL,temp,mean)
    temp<-merge(ann,temp)
    temp<-temp[,-1]
    temp<-aggregate(.~GeneSymbol,temp,mean)
    rownames(temp)<-temp$GeneSymbol
    temp<-temp[,-1]
    write.csv(temp,paste0("../../AllMatrixCountGeneSymbol/",tag,".csv"))
      
    }
    

    欢迎关注~

    参考:
    https://blog.csdn.net/u011596455/article/details/79601113

    相关文章

      网友评论

        本文标题:R批量读取、处理及写出文件

        本文链接:https://www.haomeiwen.com/subject/admkqktx.html