美文网首页Linux转录组
4. 质量控制fastqc和multiqc

4. 质量控制fastqc和multiqc

作者: Y大宽 | 来源:发表于2019-05-26 22:22 被阅读39次

    看这个之前先看下批量对多个测序文件进行fastqc

    1 把所有文件进行fastqc,得到QC结果,然后用multiqc整合所有QC结果

    $ ls SRR8518*.gz|while read id;do  fastqc -t 4 $id;done 
    
    $ ls *|grep zip
    
    SRR7696207_1_fastqc.zip
    SRR7696207_2_fastqc.zip
    SRR8707702_1_fastqc.zip
    SRR8707702_2_fastqc.zip
    

    这样做显然是不行的,大概做下来得需要7天。所以批量进行,代码如下

    $ ls SRR85182*.gz | while read id;do (nohup fastqc $id &);done
    

    这个代码还有很大的改进余地,暂时先这样做,充分利用时间。

    2 multiqc进行整合

    若没有安装就先安装
    国内镜像源不能用了,用下面命令安装

    conda install -c bioconda multiqc
    multiqc --help
    /project/fastqc_result/qc$ multiqc -n wes ./
    

    python3下无法运行multiqc,所以先创建python2的wes环境

    $ conda create -n wes python=2
    $ source activate wes
    

    因为727个样本中有279个WXS数据,448个RNA-seq数据,所以这一步把html和zip文件分别进行整合到各自的html中,分组信息可以这里下载
    https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP157974

    qc下分别mkdir wes和rnaseq文件夹

    wes$ multiqc -n wes_all ./
    
    [INFO   ]         multiqc : This is MultiQC v1.0.dev0
    [INFO   ]         multiqc : Template    : default
    [INFO   ]         multiqc : Searching './'
    [INFO   ]          fastqc : Found 558 reports
    [INFO   ]         multiqc : Report      : wes_all.html
    [INFO   ]         multiqc : Data        : wes_all_data
    [INFO   ]         multiqc : MultiQC complete
    

    打开wes_all.html文件

    mean quality scores adapter content

    RNA-seq结果

    rnaseq$ multiqc -n rnaseq_all ./
    
    [INFO   ]         multiqc : This is MultiQC v1.0.dev0
    [INFO   ]         multiqc : Template    : default
    [INFO   ]         multiqc : Searching './'
    [INFO   ]          fastqc : Found 896 reports
    [INFO   ]         multiqc : Report      : rna_all.html
    [INFO   ]         multiqc : Data        : rna_all_data
    [INFO   ]         multiqc : MultiQC complete
    

    mean quality scores adapter
    想看结果的可以下载
    wesmultiqc结果 密码:hyrvnh
    rnaseqmultiqc结果密码:tp1thn

    下一步需要去接头

    相关文章

      网友评论

        本文标题:4. 质量控制fastqc和multiqc

        本文链接:https://www.haomeiwen.com/subject/agqftctx.html