image-20200715190428292.png下载官网:https://www.bioinformatics.babraham.ac.uk/projects/download.html
## 下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip
## 下载后解压
unzip ./fastqc_v0.11.9.zip
## 改变解压后文件夹中的fastqc的权限(改变权限后,颜色会变成绿色)
chmod 755 ./fastqc
## 使用fastqc(按照默认的参数)
../software/FastQC/fastqc *.gz
## fastqc中的可用参数
-o --outdir :输出文件的路径,必须保证路径存在。否则就会报错。
--nano :分析nanopore 的 fast5格式的数据。
--extract :设置该参数后,输出的文件将不会是zip压缩格式,默认是没有设置该参数。
-f --format:指定检测的文件的格式( bam,sam,bam_mapped,sam_mapped and fastq)
-t --threads:设置线程数,注意没设置一个线程就会再用250MB的内存,32位的系统不能设置超过6个线程数
-a --adapter:特异性的搜索adapter信息,提前准备好一个列表文件,格式:name[TAB]sequence
-d --dir : Selects a directory to be used for temporary files written when generating report images. Defaults to system temp directory if not specified.
总结信息
image-20200715203230094.pngreads各个位置的碱基质量图
Q= -10*log(error p):p代表了错误率,Q20代表1%的错误率,Q30 代表了0.1%的错误率
序列的测序质量
序列的碱基含量
reads的平均GC分布
N含量分布图
reads的长度分布
接头序列
如果使用fastQC分析的结果比较多,可以使用mulitiqc对结果进行整合
## 可以使用conda安装
conda install -y multiqc
## 也可以下载到本地,再解压
## 使用(将当前目录中的fastqc分析整合)
multiqc ./
网友评论