下载版本选择:
NCBI-SRA下载页
最开始下载了2.10.5最新版本,发现使用以前的参数会报错识别不了参数
应该是因为新版本参数有改变,另一个原因是新版本对linux版本及环境有要求,我用的是ubuntu。
最高版本说明
所以下载了sratoolkit.2.9.6-1-ubuntu64这个版本
image.png
在该版本中,添加了fasterq-dump工具:
这是对更老的“fastq-dump”工具的替代。顾名思义,它运行得更快,更适合将SRA对象大规模转换为FASTQ文件,这些文件在拥有足够磁盘空间存放临时文件的站点上很常见。“fasterq-dump”是多线程的,它以一种比“fastq-dump”更好的方式执行批量连接,而“fastq-dump”是基于每条记录执行连接的(并且是单线程的)。
“fastq-dump”仍然受到支持,因为它处理的极端情况比“fasterq-dump”更多,但将来可能会被弃用。
关于fasterq-dump命令
用法:
fasterq-dump <path> [options]
参数:
-o|--outfile output-file #输出文件
-O|--outdir output-dir #输出目录
-b|--bufsize size of file-buffer dflt=1MB
-c|--curcache size of cursor-cache dflt=10MB
-m|--mem memory limit for sorting dflt=100MB
-t|--temp where to put temp. files dflt=curr dir
-e|--threads how many thread dflt=6 #线程数 默认参数是6
-p|--progress show progress #展示进程
-x|--details print details #展示详细信息
-s|--split-spot split spots into reads
-S|--split-files write reads into different files
-3|--split-3 writes single reads in special file #未配对reads写到特殊的文件中
--concatenate-reads writes whole spots into one file
-f|--force force to overwrite existing file(s)
-N|--rowid-as-name use row-id as name
--skip-technical skip technical reads
--include-technical include technical reads
-P|--print-read-nr print read-numbers
-M|--min-read-len filter by sequence-len
--table which seq-table to use in case of pacbio
--strict terminate on invalid read
-B|--bases filter by bases
-h|--help Output brief explanation for the program. #帮助信息
-V|--version Display the version of the program then
quit.
-L|--log-level <level> Logging level as number or enum string. One
of (fatal|sys|int|err|warn|info|debug) or
(0-6) Current/default is warn
-v|--verbose Increase the verbosity of the program
status messages. Use multiple times for more
verbosity. Negates quiet.
-q|--quiet Turn off all status messages for the
program. Negated by verbose.
--option-file <file> Read more options and parameters from the
file. #更多参数信息
最终使用的命令:
fasterq-dump -3 SRR_ID
网友评论