编者按
欢迎订阅微信公众号:基因学苑,更多精彩内容等你发掘!
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。
一、功能分类:
测序质控
二、软件官网:
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
三、软件介绍:
FastQC是一款功能强大又使用简单的软件,主要用户测序数据的质控。FastQC软件支持多种平台数据的评估,包括illumina、454、pacbio等等。软件可以支持Linux,windows,macos等多种平台,并且可以生成网页格式的报告,方便阅读。
四、下载安装:
wgethttp://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip
unzip fastqc_v0.11.7.zip
五、软件使用:
fastqc运行起来还是比较简单,如果系统安装有xming的图形化窗口,直接敲命令就会弹出图形界面模式,这个模式下可以直接点鼠标导入数据。这里我们采用命令行模式。
加上-h参数看一下有哪些选项。
这里面选项都比较简单。选择比较重要的
-f 指定输入文件的类型,支持多种格式,
-o 指定输出目录,需要先建立一个输出目录
还有一些指定是否分析kmer,是否压缩数据文件等,都比较简单。
我们拿两条测序reads来做一下演示。
先创建一个数据目录,mkdir result,然后
敲fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz;
回车之后程序就开始执行了,运行速度还是比较快的。最终会生成网页文件。
六、使用案例:
mkdirresult
fastqc-ffastq-oresultreads.1.fq.gzreads.2.fq.gz
报告模板:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/good_sequence_short_fastqc.html
七、注意事项:
1、数据质控是一个综合的评价标准,其中主要指标为碱基质量与含量分布,如果这两个指标合格了,后面大部分指标都可以通过。如果这两项不合格,其余都会受到影响。
2、其中一些指标并不适合所有数据。要根据具体数据类型,具体分析。
网友评论