美文网首页生信情报站
生信软件 | Trimmomati (质量控制,修剪低质和接头序

生信软件 | Trimmomati (质量控制,修剪低质和接头序

作者: 白墨石 | 来源:发表于2019-10-03 22:21 被阅读0次

    介绍

    • Trimmomati 用于去除 Illumina平台的FASTQ序列中的Adapter,根据碱基质量值修整FASTQ序列文件
    • 支持单末端(SE),双末端(PE)测序数据
    • 支持多线程,gzip,bzip2压缩的FASTQ文件
    • 支持phred-33 和 phred-64 格式互相转化,目前多数Illumina测序数据为phred-33格式

    安装

    conda install -c trimmomati

    这里需要安装Conda (一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件的依赖问题) : Conda 安装使用图文详解

    使用

    单末端测序数据:

    trimmomatic SE -phred33 input.fq.gz output.fq.gz ILLUMINACLIP:TruSeq3-SE:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

    双末端测序数据:

    trimmomatic PE -phred33 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

    常用参数:

    -threads 线程数,最大是CPU核数

    -trimlog 生成日志名,强烈建议不开这个参数,生成的log文件巨大且大多数情况下,你是不会看的

    -quiet 静默模式

    与其他软件命令不同,Trimmomatic提供了多种修整步骤:

    • ILLUMINACLIP:从reads中剪切adapter和其他Illumina特定序列。
    • SLIDINGWINDOW:执行滑动窗口修剪,一旦窗口内的平均质量低于阈值,则切割。
    • LEADING:如果低于阈值质量,则在reads起始处剪切碱基
    • TRAILING:如果低于阈值质量,则在reads末尾处剪切碱基
    • CROP:将reads从末尾切割为指定长度
    • HEADCROP:从reads剪切后低于指定长度,则删除
    • MINLEN:如果reads低于指定长度,则删除
    • TOPHRED33:将质量得分转换为Phred-33
    • TOPHRED64:将质量得分转换为Phred-64

    文档:http://www.usadellab.org/cms/index.php?page=trimmomatic

    双末端测序命令解释:

    PE模式中,输入文件有两个input_forward.fq.gz input_reverse.fq.gz输出文件有四个(output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz),其中过滤之后双末端序列都保留的是paired,只保留一端序列的就是unpaired

    相关文章

      网友评论

        本文标题:生信软件 | Trimmomati (质量控制,修剪低质和接头序

        本文链接:https://www.haomeiwen.com/subject/jhljpctx.html