美文网首页
【生信基础】根据SRA号批量下载fastq文件的一种实现方法

【生信基础】根据SRA号批量下载fastq文件的一种实现方法

作者: Geekero | 来源:发表于2020-03-27 15:36 被阅读0次

    一、思路分析:

    百度一下,看看有没有没有现成的批量下载方法

    二、查到的一种比较简介的可以直接下载fastq文件的方法

    echo SRR1553608 > sra.ids
    echo SRR1553605 >> sra.ids
    # 利用sed和bash
    cat sra.ids|sed 's/SRR/fastq-dump --split-files SRR/'|bash
    

    三、根据项目编号下载整个项目的fastq文件

    • 到NCBI下载runinfo信息(更简单的方法是使用通过EDirect获取runinfo,但是发现这个安装总是不成功,所以用笨方法)
    • 导出后的runinfo信息,放到服务器中, 获取所有样本的SRR号

    运行:

    nohup cat sra.ids|sed 's/SRR/fastq-dump --split-files SRR/'|bash 2>&1 >log &
    

    其实还能用多线程

    运行:

    time for i in SRR*; do pfastq-dump --split-3 --threads 12 -O pfastq_dump_result -s $i ; done
    

    参考文章

    相关文章

      网友评论

          本文标题:【生信基础】根据SRA号批量下载fastq文件的一种实现方法

          本文链接:https://www.haomeiwen.com/subject/uegluhtx.html