Shalizi MN, Isik F (2019) Genetic parameter estimates and GxE interaction in a large cloned population of Pinus taeda L. Tree Genet Genomes 15:46. doi: 10.1007/s11295-019-1352-7
火炬松一个大型无性系群体的遗传参数估计和GXE相互作用
摘要
在林木育种中进行克隆后代试验,可以评估不同环境中相同的基因型,并将观察到的表型变异分为加性和非加性遗传效应。本研究在美国南部的8个地点对53个火炬松(Pinus taeda L.)杂交种的2362个无性系进行了测试。 Alpha循环不完全行-列设计用于在复制中容纳大量克隆。采用混合模型的各种方差协方差结构,对6岁时的树干体积(立方米)进行了评估。具有因子分析加性遗传结构和空间相关残差或多项式固定行列效应的模型有效地捕获了数据中的异质性。对于简单的复合对称加性遗传结构,茎体积的狭义克隆平均遗传力估计值为0.41。对于更复杂的模型,估计值更高,从0.56到0.61不等。茎体积的非加性遗传变异约占加性遗传变异的一小部分,说明该性状主要受大量基因控制,每个基因的作用较小。结果表明,对于具有大量遗传条目的林木遗传田间试验,育种者应考虑不完全行柱设计,以模拟两个方向的微位点异质性。这些设计允许使用行和列信息进行空间建模,这可以有效地解释环境中的异质性,从而导致更高的遗传性估计和更可靠的品种选择排序。
子代测试。行列设计。因素分析。多项式趋势。自回归。克隆平均遗传力
介绍
近几十年来,植根技术和组织培养的进步促进了林木克隆后代的测试(翁等,2010年)。克隆后代试验包括在多个环境中种植同一个体的拷贝(分株)。克隆测试策略不仅提供了附加遗传变异的估计,还提供了非附加遗传效应(优势和上位遗传变异)和广义遗传性(Foster和Shaw,1988年;Frampton Jr和Foster,1993年;Isik等人,2003年)。此外,克隆后代检测被认为比幼苗后代检测更有效地估计非加性效应和基因型(GXE)相互作用(Carson 1986;Eriksson等人2006;Farjat 2015;Libby和Rauter 1984)。这可以提高育种值或遗传值预测的准确性,这可能导致更大的遗传收益(Burdon和Shelbourne,1974年;Isik等人,2005年)。由于更好地控制环境变化(Isik等人2003)和更好地建模GXE相互作用(Carson 1986;Libby和Rauter 1984),选择效率得到了提高。选择效率可能受到C和c效应的影响(Burdon和Shelburne,1974年);但是,这可能不是4岁以后的问题(McRae等人,1993年)。
GXE相互作用是林木后代测试的一个重要方面(Eriksson等人2006)。在克隆后代试验中,可以跨多个环境(空间或时间)复制基因型。多环境试验(MET)分析的目的不仅是评估遗传参数和育种值,而且是评估GXE相互作用的程度和基因型在多个环境中的表现。通过GXE建模,可以选择特定的基因型用于特定环境的部署,或者选择一组广泛适应的基因型用于跨多个环境的部署(Li等人2017)。
由于在许多试验中数据的异质性,MET数据分析可能具有挑战性。异质性可能是由于试验之间的年龄差异或试验之间的场地质量引起的反应变量的规模差异所致。为了克服MET数据分析中的挑战,报告了几种方法。Patterson(1978)提出了两阶段和一阶段的MET数据分析。在两步法中,基因型平均值和统计权重(不确定性度量)首先从个体试验分析中估算出来,然后将所有预测组合在一个加权线性混合模型中进行分析(Isik等人2017年;Smith等人2015年)。在一阶段分析中,所有数据同时使用不同的方差结构进行分析,以说明异质性(Isik等人2017)。
克隆遗传试验的一个好处是将观察到的变异分为由加性和非加性遗传效应解释的成分。克隆后代试验数据线性混合模型的随机成分可以扩展到遗传和非遗传部分,其中遗传效应部分可以进一步划分为加性和残余遗传效应,如Cullis等人(2014)所述。随机加性遗传效应可能代表个体后代或克隆复制系的育种价值。个体间的加性遗传协方差可以用来自系谱的分子关系矩阵或来自DNA标记的已实现关系矩阵来建模(vanraden 2008)。剩余遗传效应反映了非加性(显性和上位性)遗传成分。克隆试验中与残留遗传效应相关的方差可以通过拟合与基因型副本相关的同一矩阵来获取(Cullis等人2014)。
当使用非结构化(US)协方差结构对GXE进行建模时,根据met分析估算的参数数量呈四次方增长,因为对每个位点估计遗传方差,并对每对位点估计唯一相关性(Isik等人2017)。由于数据估计的参数数量众多,此类模型通常不会收敛到最大似然估计(Isik等人2017年;Smith等人2015年)。因子分析(FA)模型可以有效地克服Met分析中的模型收敛问题(Smith等人2001)。这些模型比较节俭,主要是因为参数数量较少(Cullis等人2010年;Smith等人2015年)。k阶fa中的参数个数(p)由p=sk+s-k(k-1)/2给出,其中s是试验点的个数,k是因子个数,远远小于根据US协方差公式估计的参数个数p=s(s+1)/2。
当站点数量较少时,如少于10个,FA模型的优势可能不明显。Gezan等人(2017)报告说,在火炬松的六种环境中,US结构优于FA结构。Isik等人(2017年)和Gezan等人(2017年)建议,如果MET数据不太大(即少于10次试验),则采用US或FA结构进行一阶段分析;如果试验地点数量较大且数据高度不平衡,则采用FA结构进行两阶段分析。通常情况下,FA模型的K因子的阶数较高。在最近几期关于这一主题的出版物中,由于解释了更大的遗传变异,K(>1)因子高阶的fa比简单模型给出了更好的结果(Chen等人2017;Cullis等人2014;Smith等人2015)。
使用旋转的位点负荷和基因型评分,可以使用主成分表示来表示GXE(Cullis等人2014;Hardner等人2010;Ogut等人2014)。主成分表明,第一个因子占GXE相关性最高,其次是因子2、3等(Smith等人2001)。得分接近0的基因型在多个环境中被认为是稳定的。biplot可用于在圆形图上显示gxe分数;但是,由于有许多基因型,biplot可能难以解释(Cullis等人2010;Gezan等人2017)。环境尺度的单图比双图能提供更多的信息。在这个图中,只有相关尺度上的位点负荷被绘制成向量,而基因型分数没有显示出来。两个向量之间角度的余弦是由环境因素引起的遗传相关性(Cullis等人2010)。
本研究利用53个火炬松全同胞家系的大量无性系(2362个)将观察到的变异分解为环境效应和遗传效应。实施α循环不完全行柱设计,以解释大量遗传条目(John和Williams 1995;Williams等人2006)。这些计算机生成的设计在林木后代测试中的实现相对较新。该设计考虑了两个方向(行和列)的环境梯度,以更好地控制环境噪声,同时最大限度地提高同一实验单元中基因型的一致性(Williams等人2006)。在数据分析过程中,该设计允许拟合阻塞单元的多项式效应,这样可以更好地捕获与行和列的线性方向不一致的环境梯度。这可能是在不应用空间残差方差结构的情况下改进模型的一种有效方法,空间残差方差结构是一阶段MET数据分析的计算要求。
本研究的目的是:(1)将观察到的茎体积表型变异分为因果成分(加性、非加性和环境);(2)计算变异成分的线性组合,如克隆平均遗传力和克隆平均遗传力。
网友评论