美文网首页生信小白
生物信息百Jia软件(五):fastqc

生物信息百Jia软件(五):fastqc

作者: 基因学苑 | 来源:发表于2019-08-01 14:20 被阅读20次

    编者按

    欢迎订阅微信公众号:基因学苑,更多精彩内容等你发掘!

    前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

    一、功能分类: 

    测序质控

    二、软件官网:

    http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

    三、软件介绍:

    FastQC是一款功能强大又使用简单的软件,主要用户测序数据的质控。FastQC软件支持多种平台数据的评估,包括illumina、454、pacbio等等。软件可以支持Linux,windows,macos等多种平台,并且可以生成网页格式的报告,方便阅读。

    四、下载安装: 

    wgethttp://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip

    unzip fastqc_v0.11.7.zip

    五、软件使用: 

    fastqc运行起来还是比较简单,如果系统安装有xming的图形化窗口,直接敲命令就会弹出图形界面模式,这个模式下可以直接点鼠标导入数据。这里我们采用命令行模式。

    加上-h参数看一下有哪些选项。

    这里面选项都比较简单。选择比较重要的

    -f 指定输入文件的类型,支持多种格式,

    -o 指定输出目录,需要先建立一个输出目录

    还有一些指定是否分析kmer,是否压缩数据文件等,都比较简单。

    我们拿两条测序reads来做一下演示。

    先创建一个数据目录,mkdir result,然后

    敲fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz;

    回车之后程序就开始执行了,运行速度还是比较快的。最终会生成网页文件。

    六、使用案例: 

    mkdirresult

    fastqc-ffastq-oresultreads.1.fq.gzreads.2.fq.gz

    报告模板:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/good_sequence_short_fastqc.html

    七、注意事项:

    1、数据质控是一个综合的评价标准,其中主要指标为碱基质量与含量分布,如果这两个指标合格了,后面大部分指标都可以通过。如果这两项不合格,其余都会受到影响。

    2、其中一些指标并不适合所有数据。要根据具体数据类型,具体分析。

    相关文章

      网友评论

        本文标题:生物信息百Jia软件(五):fastqc

        本文链接:https://www.haomeiwen.com/subject/nobqdctx.html