美文网首页
解决基因组组装困扰,单倍型基因组帮你搞定!

解决基因组组装困扰,单倍型基因组帮你搞定!

作者: 极智基因 | 来源:发表于2023-08-06 16:57 被阅读0次

目前动植物基因组大多采用二倍体或多倍体材料直接进行测序组装,对于复杂基因组如高杂合、大基因组等,组装的难度很高。同时,二倍体或多倍体组装的结果忽略了同源染色体间的差异,混杂了双亲等位基因组的嵌合序列,可能会引入错误的基因注释信息。

这时候我们就需要借助单倍型基因组来进行组装。那么,什么是单倍型基因组?对于二倍体基因组而言,两套同源染色体,一套来自母本,一套来自父本,同源染色体间是存在差异的,通过单倍型基因组组装,能获得两套序列集合。单倍型基因组的组装对于单倍型之间结构变异分析、物种遗传起源进化研究、性染色体演化、有害突变研究以及探究杂种优势形成的分子机制具有重要的意义。

近几年,多个物种完成了单倍型参考基因组(Haplotype-resolved genome或Phased diploid genome)组装,极智基因针对已发表的单倍型基因组进行了汇总整理:

下面小编用三个案例介绍一下单倍型基因组的研究思路。

案例1:荔枝单倍型基因组

发表时间:2022年1月

影响因子:41.307

测序策略:Illumina(~66×)+PacBio(~124×)+Hi-C (~144×)+10× Genomics

组装软件:Canu (v.1.6)、Juicer35 (v.1.6.2)、3D-DNA

研究内容:

荔枝是一种具有独特风味的异国情调的热带水果。将品种“妃子笑”的基因组组装成15条假染色体,总计约为470 Mb。高杂合性(2.27%)形成两个完整的单倍型组合。研究发现共有13517个等位基因(42.4%)在不同组织中存在差异表达。同时,对72份重测序的荔枝种质的分析揭示了两个独立的驯化事件。优先比对到一个单倍型的极早成熟品种是从云南的一个野生种群中驯化的,而主要定位到第二个单倍型的晚熟品种则是从海南的野生种群中独立驯化的。广东的早熟品种可能是通过极早熟品种与晚熟品种个体杂交而开发的。由一对CONSTANS-like基因包含的3.7 kb区域的可变缺失可能调控荔枝品种之间的果实成熟差异。故此,这些基因组资源为了解荔枝驯化的自然历史提供了见解,并将加速荔枝和相关作物的改良。

图1 荔枝单倍型基因组[1]

案例2:杨树单倍型基因组

发表时间:2022年7月

影响因子:10.806

测序策略:PacBio+Hi-C

组装软件:Hifiasm assembler (v0.15.3-r339)

研究内容:

本研究组装了三倍体杨树的单倍型参考基因组,并利用反向遗传学和生化方法鉴定了一个MYB基因:SALT RESPONSIVE MYB TRANSCRIPTION FACTORSRMT),该基因结合了NUCLEAR FACTOR Y SUBUNIT C9PtoNF-YC9)和RESPONSIVE TO DESICCATION 26PtoRD26),以调节ABA依赖性盐胁迫响应信号。该研究揭示了盐诱导的PtoRD26依赖于ABA信号传导并证明了ABA或盐驱动PtoNF-YC9穿梭到细胞核中,并与SRMT相互作用,导致PtoRD26快速表达,而它又直接调节SRMTSRMT-PtoRD26的这种正反馈环路可以快速放大盐胁迫信号。对该调节模块的任一组分的干扰都会降低这种三倍体杨树的耐盐性。研究结果揭示了一种新型的ABA依赖性盐响应机制,该机制由PtoNF-YC9-SRMT-PtoRD26模块介导,该模块赋予这种三倍体杨树耐盐性。综上,这些基因也可能作为育种计划中潜在和重要的修饰靶点。

图2 中国白杨树单倍型基因组[2]

案例3:草莓单倍型基因组

发表时间:2023年1月

影响因子:5.404

测序策略:PacBio+Hi-C

组装软件:Hifiasm version 0.16.1、3d-DNA、Bowtie 2

研究内容:

栽培草莓(Fragaria × ananassa)是蔷薇科多年生草本植物,是一个复杂的八倍体,大多数位点具有高杂合度。然而,目前还没有关于草莓八倍体基因组的单倍型的研究。本研究利用单分子实时测序和高通量染色体构象捕获技术,获得栽培草莓品种“艳丽”的高质量基因组。“艳丽”基因组大小为823 Mb,长末端重复组装指数为14.99。基因组被分为两种单倍型,Hap1(825 Mb,contig N50为26.70 Mb)和Hap2(808 Mb,contig N50为27.51 Mb)。利用Hap1和Hap2的组合,该研究首次获得了栽培八倍体草莓的具有56条染色体的单倍型参考基因组。在2-1号染色体上发现了一个~10 Mb的倒置和易位。在Hap1和Hap2中分别注释了104957和102356个蛋白编码基因。通过对花青素生物合成途径相关基因的分析,揭示了八倍体F. × ananassa基因组中等位基因表达的结构多样性和复杂性。综上所述,研究获得了高质量的F. × ananassa单倍型参考基因组组装,为研究栽培八倍体草莓的基因功能和基因组进化提供了基础。

图3 “艳丽”基因组的单倍型参考基因组[3]

综上,单倍型基因组组装基本以Pacbio Hifi+Hi-C为主。大多数文章利用单倍型基因组联合其他组学分析从而进一步将研究深化。极智对于单倍型基因组组装采用以下策略进行,同时也会针对不同的材料进行测序方案设计。

极智单倍型基因测序策略

极智单倍型基因组部分项目案例

在组装单倍型参考基因组后,我们还可以进行以下分析内容:

1.两套单倍型基因组组装和注释的基因特征比较

2.两套单倍型基因组共线性分析,检测结构变异

3.分析两套单倍型基因组上基因表达情况,结合物种不同组织部位或者不同发育时期研究等位基因不平衡表达情况

4.分析结构变异所在基因或者附件基因的表达情况

参考文献:

[1] Hu G, Feng J, Xiang X, et al. Two divergent haplotypes from a highly heterozygous lychee genome suggest independent domestication events for early and late-maturing cultivars. Nat Genet. 2022;54(1):73-83.

[2] Tong S, Wang Y, Chen N, et al. PtoNF-YC9-SRMT-PtoRD26 module regulates the high saline tolerance of a triploid poplar. Genome Biol. 2022;23(1):148.

[3] Mao J, Wang Y, Wang B, et al. High-quality haplotype-resolved genome assembly of cultivated octoploid strawberry. Hortic Res. 2023;10(1):uhad002.

相关文章

  • 使用purge_haplogs处理基因组杂合区域

    FALCON和Canu的组装后会得到一个单倍型融合的基因组,用来表示二倍体基因组。之后,FALCON Unzip和...

  • 单体型基因组的组装分类

    目前热门的单体型基因组组装,以下内容来源于安诺的单体型基因组组装新品发布会单体型也称为单倍型。二倍体有两套染色体单...

  • 利用purge_haplotigs去杂合

    当基因组某些区域可能有着比较高的杂合度,这会导致基因组该区域的两个单倍型被分别组装成primary contig,...

  • Prakapenka2020 单倍型GP的计算程序

    GVCHAP:使用单倍型和SNP标记进行基因组预测和方差成分估计的计算管道 单倍型预测模型为提高基因组选择的准确性...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 【转】单倍型基因组组装方法

    1. 什么是单倍型? 同源染色体:同源染色体,一个来自母本,一个来自于父本。 单倍型:单倍体基因型的简称。遗传学上...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 「干活」基因组组装 学习笔记 - 入门知识点和Genome Su

    基因组组装学习笔记(一) 基因组组装的前期工作:需要掌握什么知识点? 1)基因组大小 / genome size:...

网友评论

      本文标题:解决基因组组装困扰,单倍型基因组帮你搞定!

      本文链接:https://www.haomeiwen.com/subject/yqlwpdtx.html