NCBI-SRA数据的下载方法

作者: 大号在这里 | 来源:发表于2020-08-14 08:31 被阅读0次

NCBI-SRA数据的下载方法
可能是下载公共数据fastq.gz最快的方法【new】
NCBI-SRA数据下载的3种方法
MAC版: 保姆式SRA Toolkit下载原始数据
从NCBI-SRA和EBI-ENA数据库下载数据
SRA数据库（2018-06-03）
从NCBI-SRA和EBI-ENA数据库下载数据
使用SRA Toolkit下载NCBI-SRA原始数据教程
TCGA突变数据下载与处理
TCGA数据下载和整理的三种方法

SRA 数据库： 为Sequence Read Archive 的缩写。主要存储高通量测序的原始数据，来自四个测序平台，分别为：Roche_LS454，Illumina，ABI_SOLID和HELICOS。从事生物信息分析的老师和同学一般都会接触SRA数据，下载SRA数据的方法也有很多，这里来简单总结一下。

一、SRA　Tookit下载

SRA Tookit 是NCBI 提供的下载软件，我们需要下载安装，下载地址：https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

选择需要的SRA Tookit 版本进行下载，下载后直接解压到某个指定位置即可。然后搜索SRA数据，例如，我们要下载SRP108428（阅读文献可以找到公开数据的project号）下的所有数据，打开NCBI网址：https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP108428（此处为project号），点击"Accession List"键，下载得到SRR List 储存在sra.txt文件中。

sra.txt

使用SRA Tookit 的prefetch进行下载，prefetch放在sratoolkit文件夹下的bin目录。

sratoolkit-centos_linux64/bin/prefetch --option-file sra.txt

具体教程：

二、迅雷下载

例如，我们要下载SRP108428（阅读文献可以找到公开数据的project号）下的所有数据，打开NCBI网址：https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP108428（此处为project号），点击"Accession List"键，下载得到SRR List 储存在sra.txt文件中。那么我们就可以通过下载地址规律生成所有样品的ftp的下载地址：
ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR563/SRR5631562/SRR5631562.sra
最后，将链接粘贴到迅雷下载即可，是不是很方便？