Fastp:质控 +过滤数据

作者: wo_monic | 来源:发表于2019-09-27 09:18 被阅读0次

    常规的质控和过滤数据是fastqc+trimmomatic,据说fastp更快,而且一次完成质控过滤和出图。
    fastp的github
    fastp的出版地址

    1.Fastp 软件安装

    wget http://opengene.org/fastp/fastp
    chmod a+x ./fastp
    ./fastp
    

    本地路径/home/chaim/disk/soft/fastp/fastp
    添加环境变量

    vim ~/.bash_profile
    export PATH=$home/disk/soft/fastp:PATH
    

    之后即可全局调用fastp。

    2.使用参数

    2.1 快速处理

    单端测序single end(SE)

    fastp -i in.fq -o out.fq
    

    双端测序paired end(PE)

    fastp -i in.R1.fq.gz -I in.R2.fq.gz -o our.R1.fq.gz -O  out.R2.fq.gz
    

    参数设定:
    -w 8 设置进程数8,默认2,max=16,或者是--thread 8
    -z 5 设置gzip压缩级别,默认4,1~9 1快-9小
    --json 设置输出json文件名
    --html 设置输出html文件名

    2.2 使用循环批量处理

    注意:一定要修改默认的输出文件名,不然后面的输出会覆盖前面的默认文件名

    #!/bin/bash
    for i in 71 72 75 76 78 79;do
      {
      fastp -i ~/RNAseq/SRR190242${i}_1.fastq.gz -o SRR190242${i}_1.fastq.gz -I  ~/RNAseq/SRR190242${i}_2.fastq.gz -O SRR190242${i}_2.fastq.gz -w 8 --html ${i}.html --json ${i}.json
      } 
    done
    

    相关文章

      网友评论

        本文标题:Fastp:质控 +过滤数据

        本文链接:https://www.haomeiwen.com/subject/gbkeuctx.html