美文网首页生信分析流程
Day 4_1 NCBI下载RNA-seq数据

Day 4_1 NCBI下载RNA-seq数据

作者: 陈宇乔 | 来源:发表于2018-12-11 10:23 被阅读10次

    第0步:为了加快下载速度需要配置aspera网址

    下载页面
    wget -c https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
    
    tar zxvf ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
    bash ibm-aspera-connect-3.8.1.161274-linux-64.sh
    cd # 去根目录
    ls -a # 如果看到.aspera文件夹,代表安装成功
    # 永久添加环境变量
    echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
    # 最好写绝对路径:echo 'export PATH=/home/qmcui/.aspera/connect/bin:$PATH' >> ~/.bashrc
    source ~/.bashrc
    # 查看帮助文档
    ascp --help
    

    安装成功标志:


    echo $PATH 下载时出现fasp表示安装成功

    第一步:找到并下载下载SRR_Acc_List

    NCBI SRA数据库地址
    GEO数据库地址
    Step0:直接在GEO搜索ESCC RNA-seq,点击SRA Run Selector

    step0:直接在GEO数据库中搜索ESCC RNA-seq即可

    step1:找到SRP号(project)不能是SRR号(单个样本)


    step1:找到SRP号
    必须是SRP号,不能使SRR号 step2
    step3:下载SRR_Acc_List

    第二步下载数据

    激活rna环境后 使用prefetch下载数据:

    ######可以使用循环下载
    cat SRR_Acc_List.txt | while read id; do (prefetch ${id});done 
    
    激活rna环境后 使用prefetch下载数据

    下载时可以查看硬盘大小

    df -h
    df -sh ./ ###查看当前文件夹大小 disk free human-readable
    free -h ###应该是内存吧
    
    查看硬盘大小

    相关文章

      网友评论

        本文标题:Day 4_1 NCBI下载RNA-seq数据

        本文链接:https://www.haomeiwen.com/subject/vocshqtx.html