大家好,本周给大家分享的是一篇发表在PNAS关于可可树自然群体的适应性进化的文章。
文章题目:Genomic structural variants constrain and facilitate adaptation in natural populations of Theobroma cacao, the chocolate tree (基因组结构变异限制和促进可可树自然种群的适应)
期刊:PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA (PNAS)
影响因子: 2020_IF = 11.205; 中科大类: 综合性期刊 1区; 中科小类: 综合性期刊 1区; JCR分区: Q1
发文单位:美国明尼苏达大学、宾夕法尼亚州立大学等4家研究单位。
文章作者:美国明尼苏达大学的Tuomas Hämälä为第一作者,Tuomas Hämäläa 和Peter Tiffin为共同通讯作者。
背景:可可树(Theobroma cacao)是锦葵目梧桐科可可属乔木。原产于热带美洲,广泛栽培于全世界的热带地区,其果实经过发酵及烘焙可制成可可粉及巧克力,喜欢温暖湿润的的气候[1]。
摘要:基因组结构变异(SVs)在适应和物种形成方面起着重要作用。然而人们对SVs的整体适应性效应知之甚少,有一部分原因是因为SVs在群体水平的准确识别需要几个高质量的组装好的基因组。本文中,作者在31个可可树品种染色体的单倍型水平上来研究SVs对自然种群中的适应性效应。在31份材料中,作者发现超过160000个SVs,这些SVs覆盖的基因组大小比SNPs和INDELs多8倍。结果表明,这些SVs中的绝大多数是有害的,它们以低频率分离从基因组的功能区域中消失。同时作者发现SVs可以影响基因表达,从而影响基因功能。作者还为SVs的理论预测提供了经验支持,比如倒置,通过抑制重组导致有害核苷酸突变体的积累,从而增加遗传负荷。尽管SVs在总体上是有害的,但作者确定了具有当地适应特征的单个SV,其中一些SVs与种群之间差异表达的基因有关。参与病原体抗性的基因在这些候选SVs有显著富集,表明SVs对这种重要的局部适应性状有特别的贡献。除了揭示 SVs在进化中重要性外,这 31 个基因组从头组装为可可树的遗传和育种研究提供了宝贵的资源。
主要结果:
1. 可可树结构变异(SVs)分布情况
为了鉴定31个从野生可可豆品种(四个地区)中分离的SVs(图1A),作者对每个个体分别进行从头组装。总的来说,作者重新组装的基因组比之前发表的两个参考组(Matina 1-6 version 1.1 和 Criollo B97-61/B2 version 2.0)质量更好(图1B)。将所得的每个个体的组装好的序列与参考基因组Criollo 进行互相比对,鉴定出5种类型的SV,插入(INS),缺失(DEL),串联重复(DUP),倒置(INV)和易位(TRV)。作者鉴定出36303个长度超过50 bp的特异SVs(累计163423个SVs),每个品种有4610到5963个结果结构变异(图1C)。尽管大多数SV位于基因间隔区(图1D),但在Criollo基因组中注释的64%的基因具有SVs, 且与编码区或假定的调控元件(≤基因上游或下游5 Kb)有重叠。SVs几乎存在于基因组的所有部分,但某些区域的SV数量特别高(图1E),表明这些区域为SV热点区域。总之作者从31份可可树种质中鉴定到丰富的SVs,表明SVs对可可树的进化起着重要的作用。
图1. 从62个组装的高质量基因组中鉴定SVs。(A)可可树群体的分布范围,(B) 两个公布的参考基因组(黑线)和该研究中31个组装基因组之间的序列连续性(基于5000个最长的contigs);彩色线条)。对于文中组装的的基因组,累积序列长度比参考基因组增加得更快,表明有更高的连续性,(C)每个品种鉴定的的SVs数量;(D)SV与基因组不同分型重叠的数量;(E)在基因组不同区域特异SV的数量,以2 Mb的窗口计数。
2. SVs整体有害,影响基因表达模式
SV中易位类型很少,在接下来分析中将其排除。同时将INS和DEL类型合并为INDEL类型。次要等位基因频率谱(AFS)表明相比于同义或非同义SNP,SVs的分离更多集中在低频率水平(图2A),这表明SVs对适应性的影响比SNP更有害。SVs重叠的功能性和非功能性元件之间较大频率差异也支持SVs具有更强的适应性效应(图2B)。同时作者估计了纯化选择的强度,发现位于SVs内的基因和与SV断点重叠的基因都有更高的πN/πS和dN/dS,同时不同SVs类型之间的效应强度也不同:与INV断点重合的基因比INV内的基因具有更高的πN/πS和dN/dS,而INDELs和DUP则相反(图2C)。这些结果表明与SVs重叠的基因受到较弱的选择性限制,可能是因为大多数SV在生理和发育中没有起重要的作用。为了进一步研究SVs的潜在适应性效应,作者分析了SVs对基因表达模式的影响,发现普通SVs与基因表达的相关性比期望值更高(图2D;P=1×10−9),但是,普通SVs影响基因表达的可能性比SNP少3个数量级(图2D;P=4×10−6, LRT)。与普通变异相比,稀有SVs更可能是最近出现的,并对基因表达产生不利影响。与普通变异中观察到的模式相反,稀有SVs被发现其影响基因表达的可能性与稀有SNP 相差4个数量级(图2D;P<2×10−16)。结果表明普通SVs可能是中性或有益的,对基因表达只有细微的影响。然而,稀有SVs对基因表达有更强的影响,这可能会损害基因功能并导致SVs的有害影响。
图2. SV的适应性效应。(A)与同义(sSNP)和非同义(nSNP)相比,每种SV类型的AFS;(B) SV与不同的基因组区域重合的AFS;(C)对受SV影响的基因的选择性限制的测定。SV内的基因和与SV断点重叠的基因的非同义核苷酸多样性与同义核苷酸多样性的比率(πN/πS)和非同义核苷酸与同义核苷酸差异的比率(dN/dS);(D)一个基因5 Kb以内的变异与其表达相关的可能性。普通变异:MAF > 0.05,稀有变异:MAF≤ 0.05。
3. 在倒置中遗传负荷增加
除了直接损害基因功能外,SVs的有害影响还可能通过有害核苷酸变异的积累间接产生。这种担心主要集中在INVs,因为他们经常会导致重组单倍型的完全丢失。与抑制重组的效果一致,作者发现INV排列之间的核苷酸差异增加(图3A;P<2×10−16),以及这种排列中的遗传连锁增加(图3B;P<2×10−16)。同时INVs在功能位点的衍生等位基因比例高于共线区(图3C;P<2×10−16,LRT),表明遗传负荷增加,而且在中性位点发现衍生等位基因有类似增加(图3C;P<2×10−16),反映了与共线区域相比,INV背景选择较弱。另外,次要INV也比主要INV具有更高的衍生等位基因频率(图3C;P<2×10−16),表明这些区域的Ne由于重组抑制而减少。SIFT4G预测的突变效应进一步支持了遗传负荷的增加,与共线区域相比,SIFT4G识别出INV处有害SNP的增加(图3D;P<2×10−16)。总之,作者发现在倒置这种结构变异类型中,由于重组抑制导致遗传负荷增加了。
图3. 倒置时的遗传负荷。(A) 与大小相等的随机共线区域(CTRL)相比,主要纯合子和次要纯合子(INV)之间的绝对核苷酸分化(dXY);(B) 连锁不平衡的平均衰减是共线区域以及主要和次要INV纯合子中物理距离的函数;(C) 共线区域以及主要和次要INV纯合子中衍生核苷酸等位基因的百分比。(D) 预测为有害的非同义SNP的百分比。
4. SVs有助于可可树当地的适应
SVs整体来说有害,限制了作物的适应,但有些SVs可能有助于作物对当地的适应。作者发现SVs显示出与SNPs相似但不太明显的群体结构分布(图4A)。为了确定SVs可能有助于作物当地适应,作者将SVs的FST与模拟的中性变异进行比较(图4B)。在这些SVs中,有五个INVs被确定为异常值。这些INVs可能有助于密切相关的群体,Iquitos和Nanay(三个INVs)以及Marañon和Guiana(两个INV)之间的适应性分化,这表明INVs可以抑制重组,可能保护局部有益等位基因免受基因流的影响(图4C)。同时作者对864个候选SVs内及附近基因进行GO富集,其中140个基因的SVs基因型, 对不同材料之间表达变异的解释比例高于预期(图4D)。为了进一步研究SVs在可可树对当地适应中的作用,作者利用从126份可可树材料中公开获得的全基因组数据(图4E),有3311个SVs被筛选出来(MAF>0.05),最终作者确定了45个有助于当地适应的候选SVs(图4F)。对这些SVs区域的基因富集,发现富集于对细菌的防御反应通路。表明这些SVs通过与病原体抗性有关的性状帮助可可树适应当地环境。
图4、SVs和当地的适应。(A)SVs的主成分分析;(B)与模拟中性样本(SIM)相比,三种SV类型的Fst分布;(C) 由330 Kb INV(阴影区域)引起的非重组单倍型模块。是Iquitos和Nanay群体之间基于SNP的Fst;(D) 选择异常SV影响的基因的表达水平。SV(R2)解释的具有最大比例表达变异的五个基因。(E)基于SVs的126个重测序的可可树种质之间的关系。(F)基于祖先基因组扫描的P值,包括126个种质中3011个SVs。
总之,作者认为大多数SVs是有害的,可能是由于对编码序列或基因表达有直接影响,部分也可能是由于有害核苷酸变异的积累导致的。同时作者描述了SVs如何限制和促进自然群体对当地环境的适应。通过本研究,作者也表达了人类如何有效利用有益的SVs。
文中所有图片均来自Genomic structural variants constrain and facilitate adaptation in natural populations of Theobroma cacao, the chocolate tree
文中有表述不当的地方,是我的问题,请在后台与小编联系修改,也可以自行阅读原文,谢谢理解与支持。如有团体或个人认为本文侵犯您的权利,请及时联系小编删除。
文章链接地址:https://www.pnas.org/content/118/35/e2102914118
参考文献:
- 百度百科
- Hämälä T, Wafula E K, Guiltinan M J, et al. Genomic structural variants constrain and facilitate adaptation in natural populations of Theobroma cacao, the chocolate tree[J]. Proceedings of the National Academy of Sciences, 2021, 118(35).
网友评论