目前动植物基因组大多采用二倍体或多倍体材料直接进行测序组装,对于复杂基因组如高杂合、大基因组等,组装的难度很高。同时,二倍体或多倍体组装的结果忽略了同源染色体间的差异,混杂了双亲等位基因组的嵌合序列,可能会引入错误的基因注释信息。
这时候我们就需要借助单倍型基因组来进行组装。那么,什么是单倍型基因组?对于二倍体基因组而言,两套同源染色体,一套来自母本,一套来自父本,同源染色体间是存在差异的,通过单倍型基因组组装,能获得两套序列集合。单倍型基因组的组装对于单倍型之间结构变异分析、物种遗传起源进化研究、性染色体演化、有害突变研究以及探究杂种优势形成的分子机制具有重要的意义。
近几年,多个物种完成了单倍型参考基因组(Haplotype-resolved genome或Phased diploid genome)组装,极智基因针对已发表的单倍型基因组进行了汇总整理:
下面小编用三个案例介绍一下单倍型基因组的研究思路。
案例1:荔枝单倍型基因组
发表时间:2022年1月
影响因子:41.307
测序策略:Illumina(~66×)+PacBio(~124×)+Hi-C (~144×)+10× Genomics
组装软件:Canu (v.1.6)、Juicer35 (v.1.6.2)、3D-DNA
研究内容:
荔枝是一种具有独特风味的异国情调的热带水果。将品种“妃子笑”的基因组组装成15条假染色体,总计约为470 Mb。高杂合性(2.27%)形成两个完整的单倍型组合。研究发现共有13517个等位基因(42.4%)在不同组织中存在差异表达。同时,对72份重测序的荔枝种质的分析揭示了两个独立的驯化事件。优先比对到一个单倍型的极早成熟品种是从云南的一个野生种群中驯化的,而主要定位到第二个单倍型的晚熟品种则是从海南的野生种群中独立驯化的。广东的早熟品种可能是通过极早熟品种与晚熟品种个体杂交而开发的。由一对CONSTANS-like基因包含的3.7 kb区域的可变缺失可能调控荔枝品种之间的果实成熟差异。故此,这些基因组资源为了解荔枝驯化的自然历史提供了见解,并将加速荔枝和相关作物的改良。
图1 荔枝单倍型基因组[1]案例2:杨树单倍型基因组
发表时间:2022年7月
影响因子:10.806
测序策略:PacBio+Hi-C
组装软件:Hifiasm assembler (v0.15.3-r339)
研究内容:
本研究组装了三倍体杨树的单倍型参考基因组,并利用反向遗传学和生化方法鉴定了一个MYB基因:SALT RESPONSIVE MYB TRANSCRIPTION FACTOR(SRMT),该基因结合了NUCLEAR FACTOR Y SUBUNIT C9(PtoNF-YC9)和RESPONSIVE TO DESICCATION 26(PtoRD26),以调节ABA依赖性盐胁迫响应信号。该研究揭示了盐诱导的PtoRD26依赖于ABA信号传导并证明了ABA或盐驱动PtoNF-YC9穿梭到细胞核中,并与SRMT相互作用,导致PtoRD26快速表达,而它又直接调节SRMT。SRMT-PtoRD26的这种正反馈环路可以快速放大盐胁迫信号。对该调节模块的任一组分的干扰都会降低这种三倍体杨树的耐盐性。研究结果揭示了一种新型的ABA依赖性盐响应机制,该机制由PtoNF-YC9-SRMT-PtoRD26模块介导,该模块赋予这种三倍体杨树耐盐性。综上,这些基因也可能作为育种计划中潜在和重要的修饰靶点。
图2 中国白杨树单倍型基因组[2]案例3:草莓单倍型基因组
发表时间:2023年1月
影响因子:5.404
测序策略:PacBio+Hi-C
组装软件:Hifiasm version 0.16.1、3d-DNA、Bowtie 2
研究内容:
栽培草莓(Fragaria × ananassa)是蔷薇科多年生草本植物,是一个复杂的八倍体,大多数位点具有高杂合度。然而,目前还没有关于草莓八倍体基因组的单倍型的研究。本研究利用单分子实时测序和高通量染色体构象捕获技术,获得栽培草莓品种“艳丽”的高质量基因组。“艳丽”基因组大小为823 Mb,长末端重复组装指数为14.99。基因组被分为两种单倍型,Hap1(825 Mb,contig N50为26.70 Mb)和Hap2(808 Mb,contig N50为27.51 Mb)。利用Hap1和Hap2的组合,该研究首次获得了栽培八倍体草莓的具有56条染色体的单倍型参考基因组。在2-1号染色体上发现了一个~10 Mb的倒置和易位。在Hap1和Hap2中分别注释了104957和102356个蛋白编码基因。通过对花青素生物合成途径相关基因的分析,揭示了八倍体F. × ananassa基因组中等位基因表达的结构多样性和复杂性。综上所述,研究获得了高质量的F. × ananassa单倍型参考基因组组装,为研究栽培八倍体草莓的基因功能和基因组进化提供了基础。
图3 “艳丽”基因组的单倍型参考基因组[3]综上,单倍型基因组组装基本以Pacbio Hifi+Hi-C为主。大多数文章利用单倍型基因组联合其他组学分析从而进一步将研究深化。极智对于单倍型基因组组装采用以下策略进行,同时也会针对不同的材料进行测序方案设计。
极智单倍型基因测序策略
极智单倍型基因组部分项目案例
在组装单倍型参考基因组后,我们还可以进行以下分析内容:
1.两套单倍型基因组组装和注释的基因特征比较
2.两套单倍型基因组共线性分析,检测结构变异
3.分析两套单倍型基因组上基因表达情况,结合物种不同组织部位或者不同发育时期研究等位基因不平衡表达情况
4.分析结构变异所在基因或者附件基因的表达情况
参考文献:
[1] Hu G, Feng J, Xiang X, et al. Two divergent haplotypes from a highly heterozygous lychee genome suggest independent domestication events for early and late-maturing cultivars. Nat Genet. 2022;54(1):73-83.
[2] Tong S, Wang Y, Chen N, et al. PtoNF-YC9-SRMT-PtoRD26 module regulates the high saline tolerance of a triploid poplar. Genome Biol. 2022;23(1):148.
[3] Mao J, Wang Y, Wang B, et al. High-quality haplotype-resolved genome assembly of cultivated octoploid strawberry. Hortic Res. 2023;10(1):uhad002.
网友评论