美文网首页
凌恩生物经典文献分享:孟德尔诞辰200周年,Nature Gen

凌恩生物经典文献分享:孟德尔诞辰200周年,Nature Gen

作者: 凌恩生物 | 来源:发表于2023-02-20 15:35 被阅读0次

本期为大家分享的文章是2022年发表在《Nature Genetics》上的一篇文章“Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics”,作者通过结合三代pacbio测序、染色体构象捕获(Hi-C)测序等前沿测序技术,重新构建了豌豆的基因组,并对116份豌豆材料开展了泛基因组的研究,该研究结果为豌豆基因组的进化和驯化提供了见解,也为豌豆遗传学和育种的研究提供了宝贵的基因组资源。

发表期刊:Nature Genetics

发表时间:2022

影响因子:41.307

DOI:10.1038/s41588-022-01172-2

一、研究背景

研究驯化过程中表型变异的遗传基础是现代遗传学和进化生物学的主要焦点之一。豌豆作为最早驯化的豆科作物之一,在推进植物遗传学方面发挥了关键作用,但它的驯化过程仍然不清楚,而且栽培豌豆和野生豌豆的遗传多样性尚未被完全揭示。虽然基于NGS技术构建的豌豆参考基因组为豆科植物的基因组进化提供了见解,然而,为了更好地理解豌豆的表型变异和基因组进化,还需要进一步优化基因组组装和基因组注释。

二、研究方法

研究基于PacBio单分子实时(SMRT)测序、10×基因组测序、染色体构象捕获(Hi-C)测序以及NGS技术,对豌豆品种ZW6基因组进行了de novo组装。随后对116份豌豆材料进行了泛基因组的研究。

三、主要结果

1、PeaZW6基因组组装的构建与评估

本研究基于PacBio单分子实时(SMRT)测序、10×基因组测序、染色体构象捕获(Hi-C)测序以及NGS技术,构建了高质量、高连续性的ZW6染色体水平基因组(图1和表1)。

最终PeaZW6的基因组大小为3.719Gb,对染色体定位率为97.96%,相比之前基于NGS组装的Caméor (PeaCaméor)定位率(82.51%)有显著提升。优化后的PeaZW6也显示出更高的BUSCO完整性(99.38%),同时高于PeaCameor(96.78%)。PeaZW6具有98.5%的唯一遗传标记,表明染色体水平的组装与之前报道的遗传图谱具有高度的共线性。

图1 PeaZW6基因组组装图谱。 表1 豌豆基因组组装结果。

2、PeaZW6基因组注释

PeaZW6的重复元件总长度为3,249.5Mb,大于PeaCameor(2,662.5Mb)。长端重复序列(LTR)组装指数(LAI)分析表明,与PeaCameor(LAI=2.09)相比,PeaZW6(LAI=13.31)的LTR-逆转录转座子(LTR-RT)完整性有显著改善(图2a,b)。

PeaZW6共鉴定出47,526个编码基因。PeaZW6中蛋白质编码基因的长度分布与苜蓿属相当,而苜蓿属的基因组大小只有豌豆的八分之一(图2c)。此外,长度超过2 kb的基因具有相似的表达宽度模式(图2d)。这些结果表明,豌豆基因组中的高重复序列含量可能对基因结构或蛋白质编码基因的表达谱影响不大。

图2 重复序列的比较和功能表征。

3、基因多态性与种群遗传结构

研究经过严格过滤,从118份豌豆材料中鉴定了高质量的SNPs和indels,大部分SNPs和indels位于基因间区,同时提取了大于30bp的结构变异(SVs),主要由删除类型组成(94.5%)。

为明确栽培豌豆和野生豌豆的系统发育关系和群体遗传结构,研究进一步对SNP和SV数据集进行了混合分析。在P. sativum中鉴定出3个遗传类群,其中P. sativumIV(PSIV)为一个较早的分化类群(图3b,c)。P.II(PSII)和P.III(PSIII)主要对应于不同地理区域(即亚洲和欧洲)栽培豌豆的两个遗传类群,可能与豌豆驯化后的传播途径有关。

基于SNP和SV数据集构建的系统发育树(图3a,d)结果显示,主要分支的系统发育关系相似,与ADMIXTURE结果的主要遗传类群具有良好的对应关系。此外,P. fulvum、P. abyssinicum和P. sativum形成了三个独立的分支(图3a,d),这在对SNP和SV数据集的主成分分析中得到了支持(图3e,f)。

图3 基于SNPs和SVs,对118个具有代表性的栽培豌豆和野生豌豆进行群体基因组分析。

4、QTL分析和孟德尔遗传位点的重新发现

为探索豌豆重要农艺性状的遗传基础,对300个F2群体(WJ×ZW6)的12个农艺性状进行了QTL分析,构建了7个跨度924.1 cM的高密度(0.31 cM)遗传连锁图谱。有25个QTL与12种农艺性状相关,其最高的表型变异解释度高达68.7%(图4a)。在同源性比对和功能注释的结果发现了两个先前已知的孟德尔性状的遗传位点,R(粒型)和Le(株高),以及一个可能与荚形相关的候选基因(Psat05G0794700)。然而,这些基因都没有落在假定的选择区域,这意味着它们可能与豌豆驯化没有密切相关(图4e-g)。

图4 豌豆12个农艺性状以及3个孟德尔性状相关QTL的候选基因和选择性信号的QTL分析结果。

5、基于118个栽培豌豆和野生豌豆的泛基因组分析

为了更深入地了解Pisum的多样性,研究对118份栽培和野生豌豆材料的个体de novo组装进行了泛基因组分析。Pisum的核心基因、soft-core基因、shell基因和cloud基因分别占预聚类基因总数的35.19%、15.54%、44.28%和4.99%。PAVs的系统发育树也显示出116份Pisum材料的明显分离,这与基于SNPs和SVs的结果高度一致,这表明,导致豌豆驯化的重要遗传变异也埋藏在PAVs中。

为了检测泛基因组中的基因偏好和功能富集,通过PAV模式将HOGs进一步聚类为8类,命名为A至H(图5c)。结果表明,fulvumabyssinicum种质资源具有丰富的独特基因,具有潜在的育种价值。

最后,PAV聚类、遗传群和遗传群中独特泛基因的GO功能富集在保守基因和可变基因之间呈现分化的功能富集。P. abyssinicum特有的泛基因在刺激反应和化学反应中富集,而P. fulvum的泛基因在发育、生长、繁殖、细胞骨架和向性方面富集。这进一步证实了P. abyssinicum和P. fulvum作为育种材料对提高豌豆品种抗性和产量的潜在价值。

图5 基于116个有代表性的栽培豌豆和野生豌豆的泛基因组分析。

总结

综上所述,本文提供的高质量的参考基因组和泛基因组为豌豆基因组的进化和驯化提供了见解,并为豌豆遗传学和育种研究提供了宝贵的基因组资源。这项研究将填补以往的基本模型和现代基因组学之间的空白,以促进豌豆的研究和作物改良。

       凌恩生物技术平台实力挑战超大、超复杂、高重复、多倍体及高杂合基因组,满足您不同层次分析要求。技术团队负责人人均十余年组学数据处理及项目经验,具有丰富的基因组组装及深度挖掘项目经验,可实现完整的基因组组装,为遗传学发现、性状发现、关联研究、基因组选择与基因编辑等提供坚实的基础框架。

凌恩技术团队参与项目:

参考文献:

Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics. Nature Genetics, 2022.

DOI: 10.1038/s41588-022-01172-2

相关文章

网友评论

      本文标题:凌恩生物经典文献分享:孟德尔诞辰200周年,Nature Gen

      本文链接:https://www.haomeiwen.com/subject/lcdgkdtx.html