美文网首页
使用GetOrganelle组装得到破碎化基因组的一种挽救方法

使用GetOrganelle组装得到破碎化基因组的一种挽救方法

作者: Yizhe_Lin | 来源:发表于2024-12-16 21:29 被阅读0次

出现破碎化的基因组组装(不成环,图1),通常是DNA提取、建库等上游实验流程的过失,在不影响(方便)下游分析的情况下,是可通过一些措施弥补的。并且在GetOrganelle组装的最初结果中,仅有较少的gap时,这种弥补措施更有效。

图1 一个接近完美的不成环基因组

原理:基于参考基因组,使用N/?填充gap。这并不会对原有gap基于clean_data进行补充,而是使用N/?填充这些区域。

流程:
(1)使用join_spades_fastg_by_blast.py调整assembly_graph.fastg.extend- *.fastg文件。assembly_graph.fastg.extend-*.fastg是一个简化的组装结果,是GetOrganelle初步组装的文件之一(图2)。在上述不完美的基因组组装所得的该文件中,这个简化的组装结果包括了196个contigs。经join_spades_fastg_by_blast.py调整得到*.Ncontigs_added.fastg,该文件包含了674个contigs。我不太清楚这其中的原理,但这个调整后的*.fastg文件包含了每个contigs内部的gaps与overlap信息(如果存在),只是尚未填充N/?,这是流程的第二步。

图2 GetOrganelle组装初步结果与join_spades_fastg_by_blast.py对assembly_graph.fastg.extend- *.fastg的调整

(2)使用get_organelle_from_assembly.py填充N/?,并基于*.Ncontigs_added.fastg文件尝试组装环状基因组。输出的结果可能与GetOrganelle的初步组装看起来类似(图3)。但embplant_pt.scaffolds.graph1.1.path_sequence.fasta里头已经是没有gap的单一scaffolds了(在本案例中)。虽然仍旧没有成环,但与初步的结果相比,有了提升。如果打开embplant_pt.scaffolds.graph1.1.path_sequence.fasta可以发现原先的contigs之间被填充了N/?(图5)。

图3 使用get_organelle_from_assembly.py获取新组装的输出结果 图4 新组装 图5 为减少contigs的数量,新组装被填充了N/?

该案例的结果显示,在叶绿体的大单拷贝(LSC)区仍然存在一个无法填补的gap,也许只能通过实验弥补。比如利用gap两端的序列作探针,然后PCR扩增这些缺失的片段。


p.s. join_spades_fastg_by_blast.py与get_organelle_from_assembly.py脚本通过conda安装的GetOrganelle均有,可在环境中直接使用。


参考资料:
[1] What should I do with incomplete result/"broken assembly graph"?

相关文章

  • 将叶绿体基因组上传至NCBI

    目的 将公司测序并筛选得到的叶绿体基因组上传至NCBI 方法 使用getorganelle,blastn,cpga...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 教程 | 使用 CPGAVAS2 进行叶绿体基因组注释

    写在前面 前述,介绍了使用 GetOrganelle 软件进行植物叶绿体基因组组装。测试了下软件,130个样品,直...

  • 叶绿体基因组组装

    getorganelle[https://github.com/Kinggerm/GetOrganelle]组装叶...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 使用GetOrganelle软件组装叶绿体基因组

    今天的推文简单介绍一下使用GeOrganelle这款软件利用全基因组重测序数据组装叶绿体基因组的过程 现在做植物的...

  • 02-Hi-C辅助基因组安装

    基因组组装 基因组是怎么组装的,目前的方法有什么局限性?为什么要进行基因组组装?是因为目前的测序方法,无论是一代、...

  • 组装结果统计及绘图

    组装结果统计 下面对组装得到fasta 格式基因组序列进行长度、N50 等统计。 使用assembly-stats...

  • 基因组组装----SOAPdenovo2

    1.基因组组装的流程 基因组组装的大概流程如下: (1) 测序得到raw reads序列。 (2) Reads质量...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

网友评论

      本文标题:使用GetOrganelle组装得到破碎化基因组的一种挽救方法

      本文链接:https://www.haomeiwen.com/subject/xxmhejtx.html