黄瓜(Cucumis sativus)是重要蔬菜作物,也是研究植物性别决定和维管束生物学的重要模式系统。黄瓜基因组参考序列和种质资源全基因组遗传变异研究推动了重要农艺性状基因的鉴定和利用。大量重要农艺性状由较长DNA序列片段的结构变异控制,但结构变异较难分析,因此需要通过泛基因组研究全面鉴定黄瓜基因组的结构变异,进而促进黄瓜驯化和重要农艺性状相关基因的研究。
2022年2月3日,Nature Communications在线发表了青岛农业大学园艺学院张忠华教授团队题为“Graph-based pan-genome reveals structural and sequence variations related to agronomic traits and domestication in cucumber”的研究论文,该研究首次构建了高质量的黄瓜图形结构泛基因组,阐明了黄瓜驯化过程中基因组染色体核型的演化规律,鉴定了多个与黄瓜农艺性状和驯化相关的重要结构变异,并揭示了重要性状在驯化和育种改良过程中演化的基因组学基础,这为黄瓜重要基因挖掘、野生基因资源利用和分子设计育种提供了重要信息。
![](https://img.haomeiwen.com/i27925069/afb2af3bf9bc28a9.png)
中文标题:基于泛基因组作图揭示了与黄瓜农艺性状和驯化相关的结构和序列变异
发表时间:2022.02
发表期刊:Nature Communications
影响因子:17.694
DOI: 10.1136/gutjnl-2021-326789
研究设计
1、研究对象
基于前期对黄瓜115份核心种质资源的亲缘关系和演化分析(Nature Genetics, 2013),本研究共选取了黄瓜11个种质资源,包括2个东亚系(XTMC和Cu2)、3个欧亚系(Cuc37、Gy14和9110gt)、1个西双版纳系(Cuc80)和5个印度系(Cuc64、W4、W8、Hx117和Hx14),收集不同品种黄瓜幼嫩叶片。
2、测序策略
对黄瓜11个种质进行了 PacBio 测序,对三个种质品系(Cuc37、Cuc80 和 Cuc64)进行了 10X genomics和Hi-C测序。
主要结果
1、11 个黄瓜种质的染色体级别基因组组装
研究组装了11个黄瓜种质资源基因组,基因组大小从 232.5-251.1 Mb 不等,BUSCO评估结果为96.4-97.7%,表明组装结果在基因区域内的高度完整性。加上黄瓜参考品系9930,作者发现黄瓜基因组中有2.5-38.5% 是转座子,鉴定到324-531 个完整的长末端重复反转录转座子(LTR-RT)。对 11 个基因组进行基因的预测,得到 24,490-26,033 个基因,平均基因长度为3182-3302 bp,CDS 长度为1075-1124 bp(表 1)。
![](https://img.haomeiwen.com/i27925069/c43e6803af92f066.png)
2、黄瓜基因组的核型演化
通过比较这12个基因组序列,发现了在4号、5号和7号染色体上有7个特大DNA片段倒位变异(图1),这些特大倒位变异只在部分野生材料中存在,并且不同野生材料存在的变异不同,揭示了倒位变异在野生材料驯化中的逐步演化。倒位变异的存在会导致重组抑制进而限制野生资源基因的挖掘和利用,这些特大片段倒位变异的演化历史为野生材料选择应用提供了重要信息。
![](https://img.haomeiwen.com/i27925069/fa0f5150039660e6.png)
3、黄瓜泛基因组
作者构建了一个26,822 个非冗余泛基因簇的黄瓜泛基因集,包含 18,651个核心基因和 8171个非核心基因。核心基因占每个种质总基因的 80% 以上(图 2a)。泛基因组大小的模拟表明,当加入数大于或等于9时,基因簇数的曲线几乎达到平台期,进一步表明本研究中采样的12个黄瓜种质的代表性。
GO注释表明,核心基因富集了几个重要的生物过程,包括大分子修饰、糖基化和磷代谢过程,而生物过程如 DNA 整合、对包括生长素和其他激素在内的几种内源性因子的反应以及端粒维持富含非核心基因(图2b, c)。
此外,非核心基因比核心基因短,并且表达水平显著降低(图 2d, e)。核心基因的非同义/同义替换比(Ka/Ks)显著低于非核心基因,表明非核心基因可能经历了不太严格的纯化选择(图2f)。
这些结果共同表明,非核心基因表现出更快的进化速度,并且可能在黄瓜适应特定环境条件方面表现出不同的功能。
![](https://img.haomeiwen.com/i27925069/bc062833bd37ff0b.png)
4、基于黄瓜泛基因组图谱的遗传变异和变异整合
为全面鉴定黄瓜基因组的遗传变异,该研究建立了12个黄瓜基因组的共线性对应关系,比对共鉴定出290万个SNP、140万个小InDels(图3a-e)和5.6万个结构变异 (SV),其中2,624个SV影响了2,712个基因的编码区,这些SV在着丝粒周围表现出明显较低的密度(图3f, g)。将SV序列和断点信息与黄瓜参考基因组图谱整合,研究人员构建了黄瓜图形结构泛基因组,并对多个农艺性状进行了结构变异的全基因组关联(SV-GWAS)分析,成功鉴定出黄瓜性别决定相关基因m和F所在基因组区域,并直接关联到果刺基因CsGL3启动子区域的关键结构变异。
![](https://img.haomeiwen.com/i27925069/ea80f216739da902.png)
5、黄瓜结构变异对功能的影响
为进一步将潜在的 SV与黄瓜驯化和重要农艺性状的遗传变异联系起来,该研究对黄瓜果刺果瘤、开花时间和根系发育等性状进行了深入分析。在已知果瘤关键基因CsTu的外显子上新发现了三个结构变异(图4a, b),可破坏CsTu基因功能影响果瘤,并且对果刺果瘤多个基因在黄瓜115份核心种质的遗传变异进行了系统分析,发现 4895 bp 缺失存在于 1 个印度栽培种质、7 个欧亚种质和 5 个东亚种质中,而 51bp 缺失是仅在五种印度栽培黄瓜中发现(图 4d),揭示了结构变异在果实刺瘤性状相关基因中的驯化和育种选择历程。
![](https://img.haomeiwen.com/i27925069/3ac56ba28750f767.png)
开花时间在农作物驯化和地理适应的过程中发挥重要作用,黄瓜的野生祖先多开花晚,而驯化的黄瓜大多数开花早。基于黄瓜泛基因组图谱,该研究新鉴定出CsFT上游1个44-kb的结构变异,只在2份开花极晚 (~60 d) 的野生黄瓜种质中出现,系统发生关系表明这2个野生种质可能为其他黄瓜的祖先类型,并提出了CsFT位点在黄瓜驯化和和育种选择过程中的演化历程,加深了对黄瓜适应性演化机制的理解(图5)。这些结果增强了人们对黄瓜驯化和全球辐射过程中 CsFT 基因座进化的理解。
![](https://img.haomeiwen.com/i27925069/2b8f04122be5daca.png)
6、与黄瓜驯化相关的结构变异
研究确定了 2578 个 SV,位于在黄瓜驯化过程中经过选择的区域(驯化相关 SV,dSV),同时确定了 8651 个在野生组和栽培组之间表现出显著频率变化的 SV(hdSV),部分可能与野生(Cuc64)和栽培(9930)黄瓜之间相邻基因的表达显著改变有关。
栽培黄瓜的根系生长速度明显快于其野生祖先,这可能是人类强烈选择的结果。该研究还发现拟南芥 AT5G09530(PELPK1)的同源物,编码根发育的正调节因子,被命名为PELPK7.1和PELPK7.2。这两个基因附近结构变异可能在黄瓜驯化过程根系发育的改变中起重要作用,而 pINS 和 iINS(Hap1) 可能与这两个基因的差异表达有关(图6)。
![](https://img.haomeiwen.com/i27925069/886db9328ad2c454.png)
总结
本研究基于黄瓜泛基因组的构建,在种群规模上准确地对SV进行基因分型,促进识别与农艺性状相关的SV,并帮助阐明可能的选择或进化过程。本研究不仅为黄瓜基因组和重要性状的演化提供新见解,而且为黄瓜重要基因挖掘和遗传育种提供了重要平台资源和信息,为加速黄瓜育种进入全基因组设计时代奠定了重要基础。其方法论和相关结果也为甜瓜、西瓜和南瓜等瓜类作物生物学研究提供重要参考。
参考文献
Li H, Wang S, Chai S, et al. Graph-based pan-genome reveals structural and sequence variations related to agronomic traits and domestication in cucumber. Nat Commun. 2022 Feb 3;13(1):682. doi: 10.1038/s41467-022-28362-0.
往期精彩:
网友评论