美文网首页
sra-toolkit新版本和fasterq-dump命令笔记

sra-toolkit新版本和fasterq-dump命令笔记

作者: 海岛眠 | 来源:发表于2020-04-17 09:30 被阅读0次

    下载版本选择:


    NCBI-SRA下载页

    最开始下载了2.10.5最新版本,发现使用以前的参数会报错识别不了参数

    应该是因为新版本参数有改变,另一个原因是新版本对linux版本及环境有要求,我用的是ubuntu。


    最高版本说明

    所以下载了sratoolkit.2.9.6-1-ubuntu64这个版本


    image.png

    在该版本中,添加了fasterq-dump工具:
    这是对更老的“fastq-dump”工具的替代。顾名思义,它运行得更快,更适合将SRA对象大规模转换为FASTQ文件,这些文件在拥有足够磁盘空间存放临时文件的站点上很常见。“fasterq-dump”是多线程的,它以一种比“fastq-dump”更好的方式执行批量连接,而“fastq-dump”是基于每条记录执行连接的(并且是单线程的)。
    “fastq-dump”仍然受到支持,因为它处理的极端情况比“fasterq-dump”更多,但将来可能会被弃用。

    关于fasterq-dump命令
    用法:

    fasterq-dump <path> [options]

    参数:
    -o|--outfile output-file #输出文件
    -O|--outdir output-dir #输出目录
    -b|--bufsize size of file-buffer dflt=1MB
    -c|--curcache size of cursor-cache dflt=10MB
    -m|--mem memory limit for sorting dflt=100MB
    -t|--temp where to put temp. files dflt=curr dir
    -e|--threads how many thread dflt=6 #线程数 默认参数是6
    -p|--progress show progress #展示进程
    -x|--details print details #展示详细信息
    -s|--split-spot split spots into reads
    -S|--split-files write reads into different files
    -3|--split-3 writes single reads in special file #未配对reads写到特殊的文件中
    --concatenate-reads writes whole spots into one file
    -f|--force force to overwrite existing file(s)
    -N|--rowid-as-name use row-id as name
    --skip-technical skip technical reads
    --include-technical include technical reads
    -P|--print-read-nr print read-numbers
    -M|--min-read-len filter by sequence-len
    --table which seq-table to use in case of pacbio
    --strict terminate on invalid read
    -B|--bases filter by bases
    -h|--help Output brief explanation for the program. #帮助信息
    -V|--version Display the version of the program then
    quit.
    -L|--log-level <level> Logging level as number or enum string. One
    of (fatal|sys|int|err|warn|info|debug) or
    (0-6) Current/default is warn
    -v|--verbose Increase the verbosity of the program
    status messages. Use multiple times for more
    verbosity. Negates quiet.
    -q|--quiet Turn off all status messages for the
    program. Negated by verbose.
    --option-file <file> Read more options and parameters from the
    file. #更多参数信息

    最终使用的命令:

    fasterq-dump -3 SRR_ID

    相关文章

      网友评论

          本文标题:sra-toolkit新版本和fasterq-dump命令笔记

          本文链接:https://www.haomeiwen.com/subject/adisvhtx.html