对于高通量测序后的文件要进行质控QC有多个软件可以完成,包括最开始的fastqc以及对sam/bam文件的质控如:samtools、mosdepth、bamqst等。这些软件可以得到关于质控的相关数据,其中bamqst得到的指标非常多,基本上算是一步到位的呈现出来整个质控数据;但是在得到这些数据后仍需要我们做进一步的作图加工以方便更加直观的展现。
在这里介绍一下一个从头到尾包办的软件qualimap,qualimap是由java写的,无需编译可以直接使用。
官网地址:http://qualimap.bioinfo.cipf.es/doc_html/intro.html
程序本身的作图过程涉及到一些R环境的依赖包,需要提前安装,过程如下
R
#进入R环境
install.packages(“optparse”)
#此处会弹出镜像地址选择,选择China(Beijing)即可
source(“http://bioconductor.org/biocLite.R”)
biocLite(c(“NOISeq”, “Repitools”, “Rsamtools”, “GenomicFeatures”, “rtracklayer”))
安装好之后,输入qualimap即可打开图形界面,推荐在终端命令行界面进行操作。
qualimap有几个分析模式,分别是:bamqc、rnaseq、multi-bamqc、comp-counts 四种方法,这里由于平常多用bamqc,先介绍bamqc的使用,后续三种以后再进行补充介绍。
首先输入的bam文件需要进行sort,推荐使用samtools进行操作;
之后使用qualimap进行分析的命令如下:
qualimap bamqc -bam xxx.sort.bam -gff xxx.bed -outdir ./bamqc_result -outformat PDF:HTML
##参数说明##
-bam 表示输入的bam文件的路径
-gff 表示输入指定参考基因组注释信息,输入的格式可以是GFF/GTF/BED,此项为可选项;
-outdir指定输出文件夹;
-outformat指定生成报告格式(默认为HTML格式)。
运行完成后可在指定文件夹发现report的PDF和HTML文件,打开即可看到相应的质控指标及作图。
网友评论