看这个之前先看下批量对多个测序文件进行fastqc
1 把所有文件进行fastqc,得到QC结果,然后用multiqc整合所有QC结果
$ ls SRR8518*.gz|while read id;do fastqc -t 4 $id;done
$ ls *|grep zip
SRR7696207_1_fastqc.zip
SRR7696207_2_fastqc.zip
SRR8707702_1_fastqc.zip
SRR8707702_2_fastqc.zip
这样做显然是不行的,大概做下来得需要7天。所以批量进行,代码如下
$ ls SRR85182*.gz | while read id;do (nohup fastqc $id &);done
这个代码还有很大的改进余地,暂时先这样做,充分利用时间。
2 multiqc进行整合
若没有安装就先安装
国内镜像源不能用了,用下面命令安装
conda install -c bioconda multiqc
multiqc --help
/project/fastqc_result/qc$ multiqc -n wes ./
python3下无法运行multiqc,所以先创建python2的wes环境
$ conda create -n wes python=2
$ source activate wes
因为727个样本中有279个WXS数据,448个RNA-seq数据,所以这一步把html和zip文件分别进行整合到各自的html中,分组信息可以这里下载
https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP157974
qc下分别mkdir wes和rnaseq文件夹
wes$ multiqc -n wes_all ./
[INFO ] multiqc : This is MultiQC v1.0.dev0
[INFO ] multiqc : Template : default
[INFO ] multiqc : Searching './'
[INFO ] fastqc : Found 558 reports
[INFO ] multiqc : Report : wes_all.html
[INFO ] multiqc : Data : wes_all_data
[INFO ] multiqc : MultiQC complete
打开wes_all.html文件
mean quality scores adapter contentRNA-seq结果
rnaseq$ multiqc -n rnaseq_all ./
[INFO ] multiqc : This is MultiQC v1.0.dev0
[INFO ] multiqc : Template : default
[INFO ] multiqc : Searching './'
[INFO ] fastqc : Found 896 reports
[INFO ] multiqc : Report : rna_all.html
[INFO ] multiqc : Data : rna_all_data
[INFO ] multiqc : MultiQC complete
mean quality scores adapter
想看结果的可以下载
wesmultiqc结果 密码:hyrvnh
rnaseqmultiqc结果密码:tp1thn
网友评论