拟南芥自交植株雄性配子数量的适应性减少

作者: 胡小兵plus | 来源:发表于2020-08-06 20:56 被阅读0次

今天分享一篇来自nature communication上的文章，发表于今年6月份，题目为：Adaptive reduction of male gamete number in the selfing plant Arabidopsis thaliana

Abstract

雄性配子的数量是繁殖成功的关键，而且在不同物种之间和物种内部都有差异。包含雄配子的花粉粒数量的演化性减少在自交植物中广泛存在。在此，我们使用全基因组关联分析(GWAS)来识别潜在的基因座，并评估主要自交植物拟南芥中与花粉数量相关的位点选择信号。选择标记在与花粉数密切相关的区域被富集，表明受多基因选择。我们在关联最强的位点分离得到了REDUCED POLLEN NUMBER1 (RDP1)基因。我们使用CRISPR / Cas9产生的无效突变体在非标准野生种中进行定量互补试验来验证其作用。与多效性无效突变体相比，仅花粉数量受到天然等位基因变异的显著影响。这些数据支持了减少雄性配子的投入对主要自交物种有利的理论预测。

Introduction

种子植物的花粉粒数(每个花粉粒含有两个精子细胞)和动物的精子数反映的雄性配子数，已经从农业、医学和进化论的观点得到了广泛的研究。进化理论预测，繁殖系统可以作为雄性配子数量的主要选择力量。在高度混杂的异交物种中，由于雄性配子的竞争，应该产生大量的雄性配子，因此减少雄性配子数量被认为是有害的。相反，它们在较低的异交率下可能是有利的，因为它们的生产成本高，降低了适应性。在农业环境中，低花粉数在驯化过程中可能被选择了，但这可能成为小麦和其他物种杂交育种的障碍。在开花植物中，通过失去自交不亲和而从异交过渡到自交育种系统是最普遍的进化趋势之一。自交种群或种通常表现为每朵花的花粉粒数较低(以下简称花粉数)以及花的大小变小。关于花粉数量的减少是适应性进化的结果，还是由于选择减少导致的有害突变的积累，一直存在着争论，但对于花粉数量变化的遗传基础，评估其选择的分子特征，人们还知之甚少。

为了阐明花粉数量自然变异的遗传基础，我们在这里集中研究以自交为主的拟南芥。研究表明，该物种的优势自交进化比其异交近缘种的进化发生得更近。因此，除了与这些异交近缘种存在固定的、基于遗传的差异外，我们预计在目前的遗传中，花粉数量的差异可能仍然是分离的。通过利用花粉的遗传和基因组资源，我们进行了花粉数量变异的全基因组关联分析。我们发现，RDP1基因的自然变异赋予花粉数量的变异，而没有可检测的多效性。在全基因组关联分析(GWAS)相关联峰顶的选择信号中，包括了RDP1位点，支持了在自交物种中减少雄性配子投入应可为其提供优势的理论预测。

Results

全基因组关联分析及选择信号

为了研究花粉数量在一个物种范围内的变化，我们测定了144个天然拟南芥种质中每朵花的花粉数量(Fig. 1a–d; Supplementary Table 1 and Supplementary Data 1)，发现了大约四倍的变异（平均约4000）(Fig. 1e)。代表性雄蕊标本的组织学切片证实了不同标本间花粉数量的变化(Fig. 1c, d)。我们还测量了每朵花的胚珠数量(Supplementary Table 2)。我们没有发现花粉粒数和胚珠数之间存在显著的相关关系(P = 0.5164)，尽管在物种间比较中经常出现负相关，这是由于在资源分配上对雄性和雌性功能的权衡，在理论基础上所预期的。此外，我们发现，每朵花的花粉数与107个已发表的开花表型、防御表型、ionomic和发育性状的任何一个都没有显著相关(Supplementary Table 3; Supplementary Note 1)，与气候变量、地理位置或144个物种的S-单倍群也没有显著相关(Supplementary Tables 4 and 5, Supplementary Fig. 1)。这些数据表明，花粉数量的变化很大程度上与其他性状无关。

Fig. 1

为了评估与配子数有关的基因座的全基因组自然选择特征，我们首先利用这些系的全基因组单核苷酸多态性(SNP)数据集对花粉和胚珠数进行GWAS，该数据集是根据全基因组重测序数据和250k SNP数据进行估算得到的(Fig. 1f, h; Supplementary Fig. 2)。共鉴定出68个关联峰(10-kb windows having SNPs with P < 10–4)，但经Bonferroni校正后，只有一个与花粉数相关联的峰保持显著性。针对已鉴定的GWAS峰，我们进行了富集分析，以了解花粉和胚珠数量相关峰是否在长单倍型区域富集，这一区域可能存在部分或正在进行分离多态性的清除。为了识别长单倍型区域，我们首先计算了扩展单倍型的纯合性(EHH)，它测量了携带特定核心等位基因的单倍型的衰减，作为距离的函数。然后，我们获得了每个SNP的综合单倍型得分(iHS)统计量，通过控制等位基因上每个SNP的频率来比较两个等位基因之间SNP的EHH。我们发现包括花粉数相关位点在内的10kb窗口在极端iHS尾部显著富集(P < 0.05, permutation test; Fig. 1i, j; Supplementary Fig. 3)。这些位点通常显示较高的iHS评分，GWAS前五个峰值中的两个是全基因组iHS分布的异常值(Supplementary Table 6)。富集对样品组成的变化、等位基因频率的截断和窗口的使用是强有力的(Supplementary Figs. 4–6; see Supplementary Note 2 for details)。胚珠数也显示富集，但少于花粉数(Fig. 1j)。理论上，重组率和估算的准确性可以混淆 iHS 富集。为了处理这些潜在的混杂因素，我们将这些结果与107个其他表型GWAS峰的iHS富集分析结果(P < 0.0001)进行了比较，因为这些混杂因素也应该会影响其他性状的富集。我们发现，相对于开花时的叶片数量和对假单胞菌病原体的抗性等107种表型中已知的适应性性状，iHS对花粉数量GWAS峰(P = 0.002 for the top 1% iHS tail; Supplementary Fig. 3)的富集是最高的(Supplementary Table 7)。此外，iHS对胚珠数GWAS峰的富集也较显著(P = 0.030 for the top 1% iHS tail; Supplementary Fig. 3)。这些富集结果支持在整个基因组中与雄性和雌性配子数量相关的相当数量的基因座上进行了多基因选择。

Isolation of the REDUCED POLLEN NUMBER1 gene
为了进一步了解花粉数量变异的分子基础和检验假定的选择靶点的性质，我们试图鉴定花粉数量变异的基因；然而，前五个关联峰中没有任何已知的在早期雄蕊和花粉发育中功能的基因。为获得花粉数量变化基因的实验证据，我们对花粉数量相关的最高GWAS峰下的基因进行了功能分析，这解释种质间总表型变异的约20%，并且满足全基因组显著性标准(-log10 P = 7.60)。这个区域特别有趣，因为它也满足了 iHS 统计数据的全基因组显著性标准(P = 0.0149; Fig. 1i, Supplementary Fig. 7)，表明了选择性的清除。为了检验该区域的选择特征是否可能是由花粉数量以外的性状决定的，我们检查了107个已发表的表型、胚珠数量或显示气候相关的变异是否存在关联信号。在包含花粉数GWAS得分最高的SNP的10 kb窗口中，我们没有发现基因型-表型相关性低于P < 10-5，也没有发现气候-SNP相关性低于经验P值（P < 0.01），即在这一区域，除花粉数量外，其他性状的选择没有明显的证据。我们还发现，如果长单倍型是为了减少花粉数量而选择的(P = 2.152 × 10–6, t test; population structure-corrected GWAS P = 2.95 × 10–6; Fig. 1k)，那么长单倍型变异比替换单倍型变异产生的花粉数更少。
在GWAS评分最高的这一染色体区域的三个基因中(AT1G25250, AT1G25260, and AT1G25270; Fig. 1g)，功能未知的AT1G25260基因在花芽中的表达水平远高于其他两个基因(Supplementary Fig. 8)。因此，我们从Nottingham拟南芥储存中心获得了两个标准Col-0型AT1G25260 T-DNA插入的突变体。这些突变体的花粉数量减少了32%(Fig. 2a; Supplementary Table 8)。下面我们将AT1G25260称为REDUCED POLLEN NUMBER1 (RDP1)。由于rdp1-1(insertion in the 5′ UTR)和rdp1-2(insertion at the end of the coding sequence) (Fig. 2b)纯合子表达水平较低，可能是亚型突变体(Supplementary Fig. 8)。在Col-0背景下，我们使用CRISPR/Cas9系统生成了RDP1的两个渐变移码突变体(rap1-3和rap1-4)。这些突变体的花粉数量的确减少得更多，但仍然产生了相应野生型的大约一半的花粉粒(53% for rdp1-3; Fig. 2a)，说明了RDP1效应的数量特性。花粉大小略有增加，与众所周知的花粉数量与大小呈负相关关系一致，即使在相同基因型内也是如此(Supplementary Fig. 9; Supplementary Table 9)。突变表型通过转化包含RDP1的Col-0中4.3kb的基因组片段得到补充(Fig. 2a, Supplementary Fig. 9)。与RDP1突变体相比，CRISPR/Cas9诱导的AT1G25250或AT1G25270缺失突变体花粉数量没有显著变化(Supplementary Fig. 10)。RDP1 4个独立突变体的表型以及利用野生型等位基因的成功互补表明，RDP1参与了花粉数量的控制。

Fig. 2

基于系统发育分析，RDP1是酵母mRNA周转4蛋白（Mrt4p）的同源物(Supplementary Figs. 11 and 12)。MRT4基因在酵母菌中不是必需的，但其突变体表现出稍微缓慢的生长表型。Mrt4p与核糖体P0蛋白具有相似性，是P0蛋白组装到核糖体中所必需的。据报道，人核糖体P0基因在癌症中通过调节细胞增殖具有外核糖体的功能。在花药发育过程中，产孢细胞首先分裂并分化为小孢子细胞。小孢子细胞减数分裂后，形成四个小孢子，每个小孢子经过两次有丝分裂，形成含有雄配子的成熟花粉粒。rdp1-3突变体产生的小孢子细胞比野生型少(Fig. 2c–e)，表明在减数分裂前细胞数量的减少。与此一致的是，原位mRNA杂交实验检测到RDP1在产孢细胞及其衍生的小孢子细胞中表达强烈，而在小孢子中没有(Fig. 2f, g; Supplementary Fig. 13)。RDP1在其他增殖细胞中也有表达，包括在花序、花分生组织和胚珠中(Supplementary Figs. 8 and 13)，表明其在增殖对核糖体生物生成要求较高的细胞类型中具有更广泛的作用。此外，将RDP1启动子融合到uidA报告基因编码的葡萄糖醛酸酶(GUS)来评估其活性，证实了RDP1在雄蕊中的表达模式(Supplementary Fig. 14)，并在营养期的根尖和幼叶原体中显著表达；这些数据得到了反转录定量PCR实验的支持(Supplementary Fig. 8b)。与RDP1在增殖组织中的表达一致，rdp1-3缺失突变体表现出多效表型，包括营养生长缓慢和每花胚珠数量减少(Supplementary Fig. 15)。由于这些多效表型在自然环境中是有害的，这些数据表明，RDP1的自然等位基因不是无效突变(see below)。综上所述，这些数据表明RDP1在拟南芥细胞的增殖中是必需的，然而我们所鉴定的自然变异主要影响花药中孢源细胞的增殖，这与它的酵母同源物在细胞增殖中的功能一致。

RDP1的自然变异导致了花粉数量的变异

很难通过实验确定一个特定的基因是否具有对定量性状具有微妙表型影响的天然等位基因。当等位基因效应较弱时，对天然等位基因的转基因分析不够有力，因为转基因的拟南芥植株由于株系之间的差异，其表型往往高度可变，例如由于转基因插入位点的不同而导致的表型差异。相反，如果其他基因座的影响很小，定量互补试验可以通过检测自然等位基因在杂合状态下对空等位基因的影响来识别责任基因，尽管这可能会被遗传背景中的多基因效应所混淆。为了进行这种定量互补，我们利用CRISPR/Cas9技术在没有现成突变体的非标准自然培养基中生成移码的无效等位基因。

我们使用了分别具有高花粉数和低花粉数表型的Bor-4和Uod-1株系(Fig. 2b; Fig. 3)。从起始密码子上游777 bp到终止密码子下游643 bp，包含RDP1基因的区域中，两种基因的序列存在一些差异。在编码区发现1个非同义替换和6个同义替换，在非编码区发现62个置换和6个indel突变(Supplementary Fig. 16)。但两种种质均未出现明显的功能缺失突变(Supplementary Fig. 16)，且每个种质的rdp1 CRISPR突变体的花粉数量同相应的野生型相比均减少(P < 2.2 × 10^–16 for Bor-4, P = 9.84 × 10^–7 for Uod-1; Fig. 3a, b; Fig. 2h)。这些结果表明，这两个自然发生的RDP1基因变异不是无效突变，而是编码功能蛋白。RDP1的破坏对Bor-4花粉数量的影响强于Uod-1(analysis of variance (ANOVA) interaction effect P = 1.07 × 10^–5; Fig. 2h)。这一发现支持了Bor-4等位基因比Uod-1等位基因对花粉数量的促进作用更强的观点，尽管Bor-4和Uod-1遗传背景中的其他位点可能通过上位作用导致了这种差异。

为了检验RDP1的等位基因效应，我们采用了控制遗传背景的定量互补试验(Fig. 3)。在每个遗传背景下通过杂合子进行移码突变获得的F1植株中，我们比较了两种基因型：RDP1^Bor/rdp1^Uod vs. rdp1^Bor/RDP1^Uod。这些F1基因型是相同的，除了在RDP1的差异，他们都携带一个移码等位基因，但功能等位基因有所不同；由于杂交设计，CRISPR/Cas9诱变所产生的任何独立分离的脱靶效应都将在两个目标基因型组群中平均分配。我们发现，带有RDP1^Uod的株系花粉数量显著低于带有RDP1^Bor的植株(nested ANOVA, 468 flowers from 26 individuals of RDP1^Bor/rdp1^Uod and 368 flowers from 20 individuals of rdp1^Bor/RDP1^Uod, P = 4.85 × 10^–8; Fig. 3c)。这种显著性差异不能归因于随机个体差异，因为通过单独使用每个个体的平均数据进行个体检验，也观察到具有功能RDP1^Bor和RDP1^Uod等位基因的植株之间存在显著性差异(P = 0.0331)。因此，在其他相同的遗传背景下，各自功能性的RDP1单倍型会导致花粉数量的差异。我们还对两组植株的莲座叶大小、花期、胚珠数、干重和种子重进行了测定，但RDP1^Bor/rdp1^Uod与rdp1^Bor/RDP1^Uod在这些性状上均无显著差异(Supplementary Fig. 17)。因此，与实验生成的具有多效性生长缺陷的无效突变体相比，这些结果表明，在没有任何可检测到的有害多效性的情况下，RDP1的天然等位基因差异会影响花粉数量。如上所述，其他性状的基因型-表现型关联也支持这一发现。

Discussion

在此，我们分离了致使雄性配子数量自然变异的RDP1基因。本研究为包括RDP1在内的花粉数量相关基因座的多基因选择提供了依据。尽管RDP1编码的核糖体生物发生因子将是增殖生长所必需的，但自然选择的等位基因仍主要导致花粉数量减少。这类似于人类G6PD基因的一个亚型等位基因，该基因编码戊糖磷酸途径中的一种酶，由于对疟疾的抗性选择，该基因具有长单倍型。

Fig. 3

拟南芥异种杂交群体的平均花粉粒数约为18000，比我们的拟南芥中花粉粒数高出数倍(~2000–8000; Fig. 1e)。尽管导致A. thaliana和A. lyrata的谱系之间的进化分裂估计发生在大约500万年前或更早，几项研究表明，拟南芥中占主导的自交是最近才进化出来的(0-0.413 million years ago based on the timing of the loss of a self-incompatibility gene, ~0.5 million years ago based on the abundance of transposable elements, and ~0.3–1 million years ago based on the pattern of genome-wide linkage disequilibrium)。因此，除了可能固定的远亲异交同族的差异外，可以想象一些潜在的基因座，不仅限于而且包括 RDP1的位点在A. thaliana内部仍然是分离的。这可能反映了进一步减少花粉数量的一个正在进行的选择过程，这被认为是所谓的自受精综合征的一个标志。虽然我们注意到RDP1和其他分离位点的部分清除可能与向优势自交的过渡没有直接关系，但我们的分析没有发现其他选择力的证据，包括局部适应、气候关联或其他性状的多效选择。因此，我们的研究支持了减少雄性配子投入对自交占优势的物种有利的理论预测。

我们的研究还表明，利用基于CRISPR/ Cas9的等位基因进行数量互补实验将GWAS和功能分析进行了结合，为剖析数量性状自然变异背后的等位基因差异提供了一种强有力的方法。

原文
Tsuchimatsu, T., Kakui, H., Yamazaki, M. et al. Adaptive reduction of male gamete number in the selfing plant Arabidopsis thaliana. Nat Commun 11, 2885 (2020). https://doi.org/10.1038/s41467-020-16679-7

补充：
选择性清除（Selective sweep）：在中性进化理论下，一个新的突变往往需要很长一段时间才能够在群体中达到一个较高的频率，并且这些突变周围的连锁不平衡程度会因重组率的影响而在这段时间内几乎完全衰减降解。因此，基因组上绝大多数未受到选择作用的位点会始终处于随机漂变状态，彼此之间形成的连锁不平衡容易衰减，单倍型长度相对较短。然而在选择的作用下，群体有利等位基因频率则会在较短的时间内达到一个较高的值，重组的作用会受到一定程度的对冲而不能对长范围单倍型造成实质性的降解。同时，选择作用下的连锁不平衡会造成选择位点附近的中性位点的基因频率随之增加形成长范围的单倍型纯合。群体遗传学中，将这种由选择作用造成的部分染色体片段的多态性降低现象称为选择性清除。
搭便车效应（Hitchhiking Effect）：选择位点周围的中性位点得益于选择作用而出现的基因频率迅速增加的现象，则被通俗地称为“搭便车”效应。
选择信号（Selection signature）：选择性扫除和“搭便车”效应属于从不同角度表述的同一群体遗传学现象，都是选择作用在基因组上留下的明显特征，此特征被称为选择信号。
基因的随机漂移或遗传漂变（random genetic drift）：由某一代基因库中抽样形成下一代个体的配子时发生机误，这种机误引起基因频率的变化称之为基因的随机漂移或遗传漂变。换句话说，就是利用随机抽样的办法建立小群体时，由于抽样误差引起基因频率随机波动的现象。
等位基因频率（Alleles frequency）：在一个群体中，某类等位基因占该基因位点上全部等位基因数的比率。
基因型频率（Genotype Frequence）：群体中某一基因型个体的数目占群体总个数的比例。可以反映某一基因型个体在群体中的相对数量。
遗传平衡定律或哈迪.温伯格定律（Hardy-Weinburg）：在随机交配下的孟德尔群体中，如没有替他因素（基因突变、迁移和选择）的干扰，群体的基因频率和基因型频率将逐代保持不变。
连锁平衡（Linkage equilibrium）：两个基因座的等位基因组合的频率等于组成组合的等位基因各自频率的乘积，不存在优势组合，称为连锁平衡。
连锁不平衡（Linkage Disequilibrium）：相邻位点之间的非随机关联，当一个位点上的某一等位基因与另一位点上的等位基因共同出现的概率大于随机组合的假设，则这两个位点之间存在连锁不平衡。
适合度（fitness）：指一个个体能够生存并将其基因传给下一代的能力，可用相同环境中不同个体的相对生育率来衡量（即在选择中，某一基因型个体在下一代平均保留后代数的比率）。
Q-Q plot 全称是quantile-quantile plot，也就是分位图，是一种通过比较两个概率分布的分位数从而实现对两个概率分布进行比较的概率图方法。原因是，如果两个概率分布相同，那么它们的分位数也应该相同或者重叠在同一条直线上。
在GWAS 分析中，当我们通过曼哈顿图看到某些SNP 和表型性状（或者疾病）有着很强的相关信号（比如，p-value < 10^-6 甚至10^-8）时，依然不能直接认为这些位点就与表型显著相关的。这是因为基因组上基因位点的突变通常有两个来源：第一是自然选择（Selection），这里所说的自然选择不仅指达尔文在《进化论》中所描述的物竞天择，还指所有对物种适应性有影响作用的“力量”，比如高辐射环境、疾病、病毒等，这也是我们在GWAS 研究中真正关心的突变；
第二是遗传漂变（genetics drift），它是一种比较随机的基因组突变而且数量也不少，虽然也是物种演化的一种重要力量，但是由于它的突变都比较随机，目前认为它与环境的变迁没有必然联系，但也会在某些时候，有些随机的突变带来了生存优势，便会在种群中显示出它的作用。但绝大多数情况下，对于已经在群体中稳定存在的性状而言，并不认为它们有明显的作用，所以GWAS 研究是不关心这一类突变的，要把它们全部排除掉。如果发现自己得到的结果全部是这样的变异的话，那么，应该重新考虑一下如何重新设计这个分析，包括是否应该增加样本量以及想办法排除技术错误以及干扰因素等方面，或者也可能它们之间就是没有关系。
在GWAS 分析里面，QQ-plot 的纵轴是SNP 位点的p-value 值（这是实际得到的结果，observed），与曼哈顿图一样也是表示为-log10(p-value)；横轴是则是均匀分布的概率值（这是Expecte 的结果），同样也是换算为-log10。横轴的这个概率值是如何计算的呢？实际上，它就是均匀分布的分位数。分位数的个数与GWAS 研究的SNP 位点数是一一对应的。比如我们研究中使用了5 百万个基因位点，那么分位数的个数也是5 百万个，从1/5000000,2/5000000,3/5000000,...一直往下排直到5000000/5000000，当然都是转换为-log10，然后与GWAS p-value 一起作图而成。
得到QQ plot 之后，如果通过它来协作判断我们的GWAS 结果到底是好还是坏呢？
判断的秘密就在横轴为什么要用均匀分布而不是选择其它分布上。这是因为均匀分布恰好可以用来近似描述基因组上的随机漂变现象。如果表型性状并非真的受自然选择所左右，那么你应该会看到GWAS p-value 的分布和均匀分布的结果将集中在一条直线上，如果不是那么就应该能够看到相互分离的情况，特别是p-value 越低的时候分离程度就越高，QQ-plot 会翘起来（这是因为GWAS 的零假设就是与随机突变相比没有区别）。
而且，我们知道基因组上的随机漂变是一定存在的，所以一定会有位点与随机漂变相关，特别是是在p-value 比较大的位点看起来就应该和随机漂变重叠，这就表现在QQ-plot 的前半部分里。这些位点的分布会和均匀分布重叠！而且，比较好的结果是，当p-value < 10^-3 时，GWAS 结果开始与均匀分布出现快速分离——也就是说，自然选择的力量明显地显示出来了，使得结果在群体中快速摆脱随机性，最后看到一个高高翘起的QQ-plot。这时基本就可以断定，我们所研究的表型和基因型之间是存在着显著相关的自然选择作用的。

参考：http://www.360doc.com/content/18/0208/11/19913717_728563847.shtml

拟南芥自交植株雄性配子数量的适应性减少

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读