美文网首页
基因组组装结果质控软件QUAST

基因组组装结果质控软件QUAST

作者: Ai基因测序 | 来源:发表于2024-07-04 10:53 被阅读0次

chatgpt回答为什么要对denovo组装结果进行质控的回答:

基因denovo组装完成后进行质控(质量控制)是非常重要的一步,其原因主要包括以下几个方面:

确保组装的准确性:质控可以帮助检测组装过程中可能出现的错误或偏差,如错误拼接、序列重复、错配等。通过质控,可以识别并修正这些问题,从而提高组装的准确性和可靠性。

评估组装质量:质控可以评估组装结果的质量,如N50值、GC含量、基因组覆盖度等。这些指标可以帮助研究人员了解组装的完整性和连续性,从而判断组装结果是否符合预期和研究要求。

去除污染序列:在基因组组装过程中,可能会有外源DNA的污染,如细菌、病毒或其他生物的DNA。质控步骤可以检测和去除这些污染序列,确保组装结果只包含目标基因组的序列。

优化后续分析:质控可以为后续的生物信息学分析(如基因注释、功能预测、进化分析等)提供高质量的数据基础。高质量的组装结果有助于提高后续分析的准确性和可信度。

节省资源和时间:早期发现和修正组装中的问题可以避免后续分析中因为数据质量问题而产生的误差,减少重复工作的可能性,从而节省研究资源和时间。

质控通常包括以下步骤:

原始数据质控:对测序数据进行初步质量评估和过滤,如去除低质量读长、修剪接头序列等。

组装结果评估:使用各种工具和指标评估组装结果的质量,如QUAST、BUSCO等。

错误纠正:根据质控结果,对组装序列进行错误修正,如使用Pilon、REAPR等工具。

通过这些质控步骤,可以确保基因denovo组装的高质量,为后续的生物学研究提供可靠的数据基础。

N50: Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度*½时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。

N75: 与N50方法一致,不过长度为超过Contigs总长度75%时的contig序列长度。

L50: 为获得N50时contigs数量。L75: 为获得N75时contigs数量。

QUAST 一种用于评估和比较基因组组装的质量评估工具,其可以使用参考基因组和不参考基因组的情况下对组装进行评估。QUAST 将会生成许多报告、汇总表和图表。此外,QUAST 在最耗时的步骤做了并行化,运行速度相当快。

执行以下命令:

quast.py   scaffold.fasta   -1  R1.fastq   -2 R2.fastq  

(其实quast底层也是调用了各种软件,像在计算测序深度时就用了bwa和samtools)

看一下他的输出报告  :

reads_report.txt

report.pdf :

创作不易麻烦你大家关注!!

您的关注是我不断前进的动力!!!

相关文章

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 测序组装与基因注释软件

    零、相关概念 一、数据质控控制 二、 kmer基因组评估 三、基因组拼接 第四步、评估组装结果 五、基因注释

  • 组装评估软件Quast和BUSCO

    Quast 通过计算各种指标来评估基因组组装。它既可以使用也可以不使用参考基因组安装:wget https://s...

  • QUAST评估基因组组装质量

    QUAST是评估基因组组装质量的常用工具,可计算N50等contig基本信息(without reference)...

  • 二代测序组装

    Step1 :质控 Read Quality Control Step2:组装 Assembly 5、基因组评价 ...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 宏基因组分箱(二)Metabat2分箱实战

    导读 上一篇:宏基因组分箱(一)Megahit组装和QUAST质量评价。分箱工具有很多,我为什么选择Metabat...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 利用quickmerge对基因组组装的contig去重

    quickmerge是一个用来去除基因组组装中的重复的软件。 该软件没有单独的文章,是作为某个基因组组装中的衍生脚...

  • 一文看懂三代组装软件——Flye

    作者:童蒙编辑:angelica 一、介绍 Flye是用于单分子组装数据的denovo基因组装的软件。这个软件可以...

网友评论

      本文标题:基因组组装结果质控软件QUAST

      本文链接:https://www.haomeiwen.com/subject/wsbicjtx.html