美文网首页
2020-06-19 Fastp官方教程学习笔记

2020-06-19 Fastp官方教程学习笔记

作者: 热爱大自然的小和尚 | 来源:发表于2020-06-19 09:25 被阅读0次

    Fastp官方教程学习笔记

    资源

    1. OpenGene/fastp: An ultra-fast all-in-one FASTQ preprocessor (QC/adapters/trimming/filtering/splitting/merging...)

    输入和输出参数

    1. 单端:-i -o
    2. 双端:-i -I -o -O
    3. 如果不指定-o,则对QC前后的序列文件进行质检报告,但是没有输出文件
    4. -o如果以gz结尾,则对输出文件进行压缩等级为4的zip压缩
    5. --unpaired1--unpaired2指定的是未配对的文件,如果两个文件的名称相同,则将未配对的read输出到一个文件
    6. --failed_out可以指定未通过QC的read
    7. --read_to_process仅仅处理部分read
    8. --dont_overwrite

    Filtering

    1. 质量
      1. -n 指定N的数目最多为多少个
      2. -q 指定好read的phred值
      3. -u 指定不合格的read的最大的百分比
      4. -e指定average的phread值
    2. 长度:
      1. -l read的长度不短于该值的时候保留
      2. --length_limitread不长于
    3. complexity:
      1. -Y默认为30%,即相邻的碱基必须至少30%是不同的

    Adapter

    1. -a指定adapter的序列
    2. 对于双端测序数据来说,一般不用指定adapter序列,软件可以自动识别
    3. 利用--detecet_adapter_for_pe打开自动识别adapter的功能
    4. 软件有给出常用的adapter序列,在帮助文件里面有提到
    5. --adapter_fasta
    6. ==先trimauto_detect_adapter或--adapter_seq,在trim--adapter_fasta==

    cut模式

    1. -5
    2. -3
    3. -r

    miscellaneous

    1. --split_prefix_digits指定把数据分块的prefix
    2. -s分块的块数

    相关文章

      网友评论

          本文标题:2020-06-19 Fastp官方教程学习笔记

          本文链接:https://www.haomeiwen.com/subject/wwamxktx.html