美文网首页
转录组数据下载

转录组数据下载

作者: 路人里的路人 | 来源:发表于2023-04-24 23:27 被阅读0次

    本系列所有数据均来源于论文:Transcriptome analysis of an apple (Malus × domestica) yellow fruit somatic mutation identifies a gene network module highly associated with anthocyanin and epigenetic regulation

    直接从SRA官网下载

    1.官网地址:Home - SRA - NCBI (nih.gov)
    2.下载步骤:搜索框中键入SRP号\Rightarrowsearch\Rightarrow选中需要下载的数据\Rightarrowsend to Run Selector\RightarrowGO\Rightarrow进入详细界面复制其中的SRR号\Rightarrowprefetch SRRXXXXX(前提是需要服务器上安装了sratools这个软件并添加到环境变量,\Rightarrow通过prefetch.sh这个shell脚本批量下载,具体代码如下

    #!/bin/bash
    
    # 输入要下载的 SRA 数据的 Accession 号,多个 Accession 号以空格分隔
    SRA_ACCS="SRR2176358 SRR2176359 SRR2176360 SRR2176361 SRR2176362 SRR2176363 SRR2176364 SRR2176365 SRR2176366 SRR2176367 SRR2176368 SRR2176369 SRR2176370 SRR2176371 SRR2176372 SRR2176373 SRR2176374 SRR2176375 SRR2176376 SRR2176377 SRR2176378 SRR2176379 SRR2176380 SRR2176381"
    
    # 循环遍历每个 Accession 号
    for ACC in $SRA_ACCS; do
        # 使用 prefetch 下载 SRA 数据
        prefetch $ACC
        
        # 使用 fastq-dump 将 SRA 数据转换为 FastQ 文件
        fastq-dump --split-files $ACC
        
        # 可选:如果需要将下载的文件保存到指定文件夹中,可以添加以下命令
         mv ${ACC}_1.fastq /home/monkeyflower/xiaodeng/transcripotom/outputdir
        
        # 输出下载完成的提示信息
        echo "Download and conversion of $ACC completed."
    done
    
    
    sh prefetch.sh
    

    使用SRA-Exploer下载

    1.SRA-Exploer官网:SRA Explorer (sra-explorer.info)
    2.下载步骤:进入官网\Rightarrow搜索框中键入SRP号\Rightarrowsearch\Rightarrow选中需要下载的数据\RightarrowAdd to x collection\Rightarrowx saved datasets\RightarrowFastQ Downloads,点开其中的Raw FastQ Download URLs,会弹出ftp链接,复制链接\Rightarrow在服务器中使用wget命令下载刚复制的ftp链接(如wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR217/008/SRR2176358/SRR2176358.fastq.gz\Rightarrow该方法下载速度很慢,不推荐

    使用ibm-aspeara+SRA-Exploer下载

    1.SRA-Exploer官网:SRA Explorer (sra-explorer.info)
    2.安装与配置ibm-aspeara(服务器中进行)

    wget http://ftp.genek.cn:8888/jxjzjm_20200310/ibm-aspera-connect-3.9.8.176272-linux-g2.12-64.tar.gz
    #下载ibm-aspeara的安装命令
    tar -zxvf ibm-aspera-connect-3.9.8.176272-linux-g2.12-64.tar.gz
    #解压,会生成一个.sh文件,这是一个安装ibm-aspera的bash文件
    bash ibm-aspera-connect-3.9.8.176272-linux-g2.12-64.sh
    #运行bash文件,执行安装操作
    export PATH=/home/monkeyflower/.aspera/connect/bin/:$PATH
    #将ibm-aspeara加入环境变量,可随时调用
    

    3.下载步骤:进入官网\Rightarrow搜索框中键入SRP号\Rightarrowsearch\Rightarrow选中需要下载的数据\RightarrowAdd to x collection\Rightarrowx saved datasets\RightarrowFastQ Downloads,点开其中的Aspera commands for downloading FastQ files,会弹出ibm-aspeara下载的代码\Rightarrow复制代码,进入服务器粘贴即可开始下载

    相关文章

      网友评论

          本文标题:转录组数据下载

          本文链接:https://www.haomeiwen.com/subject/gkhpjdtx.html