美文网首页
linux批量下载SRA数据并完成数据转换

linux批量下载SRA数据并完成数据转换

作者: Oodelay | 来源:发表于2019-05-05 12:14 被阅读0次

    最近在收集NCBI中的相关数据,进行meta分析,探讨石油污染对土壤微生物群落在系统发育层面的影响。


    目录结构

    每个文件中都有对应的SRR_Acc_List.txt文件记录了相对应的序列文件SRR***,格式统一,执行的操作一致,所以可以进行批量操作

    在当前目录所有文件夹下,统一新建SRA和fastq子文件夹,下载序列文件至各目录下的SRA子文件夹,然后将序列文件转换成fastq文件

    for file in $(ls)  #获取当前目录下的多个文件夹
    do
    mkdir ${file}/{SRA,fastq} -p #在各个文件夹下新建SRA和fastq两个子文件夹
    
    for line in $(cat ${file}/SRR_Acc_List.txt) #获取每个文件夹中SRR**
    do
    prefetch ${line} -O ${file}/SRA #下载到对应文件夹的SRA子文件夹中
    fastq-dump ${file}/SRA/* --split-3 -O ${file}/fastq #完成数据格式转换,并输出到对应的fastq子文件夹中
    done
    
    done
    
    执行中...

    相关文章

      网友评论

          本文标题:linux批量下载SRA数据并完成数据转换

          本文链接:https://www.haomeiwen.com/subject/crmcoqtx.html