美文网首页
生信软件fastqc

生信软件fastqc

作者: 123678 | 来源:发表于2020-07-15 22:45 被阅读0次

下载官网:https://www.bioinformatics.babraham.ac.uk/projects/download.html

image-20200715190428292.png
## 下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip
## 下载后解压
unzip ./fastqc_v0.11.9.zip
## 改变解压后文件夹中的fastqc的权限(改变权限后,颜色会变成绿色)
chmod 755 ./fastqc

## 使用fastqc(按照默认的参数)
../software/FastQC/fastqc *.gz

## fastqc中的可用参数
-o --outdir :输出文件的路径,必须保证路径存在。否则就会报错。
--nano :分析nanopore 的 fast5格式的数据。
--extract :设置该参数后,输出的文件将不会是zip压缩格式,默认是没有设置该参数。
-f --format:指定检测的文件的格式( bam,sam,bam_mapped,sam_mapped and fastq)
-t --threads:设置线程数,注意没设置一个线程就会再用250MB的内存,32位的系统不能设置超过6个线程数
-a --adapter:特异性的搜索adapter信息,提前准备好一个列表文件,格式:name[TAB]sequence
-d --dir : Selects a directory to be used for temporary files written when generating report images.       Defaults to system temp directory if not specified.

总结信息

image-20200715203230094.png

reads各个位置的碱基质量图

image-20200715205603173.png
Q= -10*log(error p):p代表了错误率,Q20代表1%的错误率,Q30 代表了0.1%的错误率

序列的测序质量

image-20200715210449053.png

序列的碱基含量

image-20200715211020466.png

reads的平均GC分布

image-20200715211734621.png

N含量分布图

reads的长度分布

image-20200715212703539.png

接头序列

image-20200715213058135.png

如果使用fastQC分析的结果比较多,可以使用mulitiqc对结果进行整合

image-20200715213559156.png
## 可以使用conda安装
conda install -y multiqc
## 也可以下载到本地,再解压

## 使用(将当前目录中的fastqc分析整合)
multiqc ./ 

相关文章

网友评论

      本文标题:生信软件fastqc

      本文链接:https://www.haomeiwen.com/subject/oxqshktx.html