美文网首页遗传改良(育种)
Cappa2012 MET 单株模型 贝叶斯

Cappa2012 MET 单株模型 贝叶斯

作者: 董八七 | 来源:发表于2018-11-28 16:55 被阅读3次

    Cappa E P, Yanchuk A D, Cartwright C V. 2012. Bayesian inference for multi-environment spatial individual-tree models with additive and full-sib family genetic effects for large forest genetic trials. Annals of Forest Science, 69(5): 627–640.
    是对Cappa 2007 p-spline的扩展。

    具有加性和全同胞遗传效应的多环境空间个体树模型的贝叶斯推断用于大型森林遗传试验

    摘要

    背景

    使用单一试验空间分析获得育种值的准确性在林业中是众所周知的。然而,单森林遗传试验的空间分析方法必须适用于跨地点森林遗传试验的综合分析。

    目标

    本文将单森林遗传试验的空间分析方法扩展到多环境试验(MET)设置。

    方法

    开发了使用具有加性和全同胞家族遗传效应的个体树模型的两阶段空间MET方法。通过吉布斯采样使用贝叶斯技术估计色散参数。使用8岁大的Tsuga heterophylla(Raf)Sarg的10岁高度生长数据说明该过程。在不列颠哥伦比亚省(加拿大)和华盛顿(美国)的七个地点建立了两个系列的第二代全同胞后代试验。

    结果

    所提出的多环境空间混合模型显示出后验均值比具有“重复设置”或不完整的块alpha设计的模型的一致减少和误差方差(\sigma_e^2)精度的增加 。此外,多环境空间模型提供了狭义和广义个体树遗传力的后验平均值的平均增加(分别为h_N^2h_B^2)。在加性遗传相关的后验方法中没有观察到一致的变化(r_{A jj '})。

    结论

    虽然计算要求很高,但是所有的色散参数都是通过使用贝叶斯技术通过吉布斯采样从所提出的多环境空间个体树模型中成功估算的。所提出的两阶段空间MET方法产生比常用的非空间MET分析更好的结果。

    1简介

    树木改良计划通常涉及在一系列地点评估相似的潜在新基因型集合,并且通常使用各种实验设计评估数年。这通常被称为多环境试验(MET),其中环境构成特定的地点/年组合(Smith等2001)。 MET允许研究基因型对不同环境条件的差异响应,即,如果测试相关材料,则通过环境相互作用量化基因型的大小。环境相互作用对基因型的重要性可以通过环境之间的遗传相关性来检验,假设在两个环境中测量的特征代表两种不同的特征(Falconer和Mackay,1996)。多环境森林遗传学试验数据的混合模型分析越来越多地用于估计遗传遗传相关性(例如,见Costa e Silva等2005; Li等2007)。
    林地内的空间环境变化主要有两种类型:全球趋势或大规模变化和/或局部趋势或小规模变化。由于诸如土壤肥力,水分,深度或坡度的变化等因素,两者在林业田间试验中都是众所周知的。许多利用单一森林遗传试验的空间分析的研究显示出误差方差的一致性减少和遗传力的增加。与不同的先验实验设计相比,这通常导致育种值的准确性增加和更大的遗传增益(例如,Dutkowski等2006; Zas 2006; Cappa和Cantet 2007; Ye和Jayawickrama 2008)。已经开发了几种方法并应用于单林试验以减少环境变化的影响,例如

    • 最近邻技术(Magnussen 1990),
    • 克里金(Zas 2006),
    • 非随机函数(例如多项式)(Thomson和El-Kassaby 1988)或
    • 平滑样条(Costa e Silva等2001)和
    • 后阻塞(Ericsson 1997)。 Cappa和Cantet(2007)提出使用基于混合模型框架的立方B-splines的张量积,使用贝叶斯技术通过吉布斯采样。这是通过在二维网格中将B样条函数参数视为随机变量(即,使用随机结效应的协方差结构)来完成的。涉及单个森林遗传试验的B样条基础的张量积的二维表面提供了遗传力的增加和母亲和后代的估计育种值的准确性(Cappa和Cantet 2007; Cappa等2011)。然而,这种单森林遗传试验的空间分析方法必须适用于跨站点的组合分析,这可称为“空间MET分析”。
      近年来,空间MET分析在农业田间试验中已经变得普遍(Cullis等1998; Smith等2001; Casanoves等2005; Oakey等2007)。 Cullis等(1998)通过使用可分离的二维一阶自回归(AR(1))误差协方差拟合试验中的空间变异性,提出了一种用于多环境变化试验的地块数据空间分析的单阶段方法。每个试验的行和列的结构,以及试验中误差方差的异质性。 Smith等人(2001)将分析扩展到包括因子分析结构以近似站点之间的非结构化遗传(即,变化)协方差矩阵。 Casanoves等(2005)详细描述了试验中通过各向同性和各向异性协方差结构的误差项之间的局部空间相关性,并包括一系列18 MET花生(Arachis hypogaea L.)的不同位置的异质残差。 Oakey等人(2007)扩展了Smith等人(2001)的模型,用于评估甘蔗地块的优势效应,以及六个地点的2,663个人的血统信息。虽然多环境混合模型考虑了试验之间的遗传相关性和试验中的空间变异性优于经典的非面部模型(即更好的模型拟合和更准确的育种值预测; Ye和Jayawickrama 2008; Ding等2008),空间MET分析在森林遗传试验数据中的应用仍然相当有限(但参见Ye和Jayawickrama 2008; Ding等2008; Hardner等2010; de la Mata和Zas 2010)。
      与农业品种试验相反,森林遗传学测试中的分析通常在单个树上进行,而不是使用小区数据。此外,林业试验通常比品种试验更大,因为个体植物的规模更大,并且实现令人满意的家庭估计所需的更高复制(Dutkowski等2002)。因此,森林遗传试验通常每个地点都有大量的树木和更多的试验地点。因此,拟合具有加性和/或全同胞家族遗传效应的多环境个体树模型,同时考虑试验之间的遗传相关性和试验中的一阶段方法中的空间变异性,需要大量的计算时间和大型计算机内存(Ye和Jayawickrama 2008; de la Mata和Zas 2010)。在这项研究中,我们为几个大型森林遗传学试验的多环境空间分析开发了一个两阶段方法。 Ye和Jayawickrama(2008)以及de la Mata和Zas(2010)在相对较小的一系列森林后代试验中使用了两种空间方法(即,不超过四个测试点,每个站点有2,700棵树,不超过五个测试站点,每个站点分别有2,925棵树)。这些作者使用来自单个树混合模型的空间相关残差来校正原始数据,其具有用于行和列的可分离的二维AR(1)误差协方差结构(Ye和Jayawickrama 2008),或者使用迭代空间分析方法(de la Mata和Zas 2010)。然而,在这些研究中,对空间调整数据的分析受到限制,因为拟合更简单的多环境家系混合模型(即,不考虑树之间的加性关系)或具有限制性跨环境的遗传(协)方差结构的个体树混合模型。这种限制性遗传(协)方差结构假设所有试验中的遗传方差相等,并且所有协方差对(和相关性)在各个位点之间是恒定的;因此,不能适应环境相互作用对基因型的大小和重要性的精确研究。
      当记录和特征的数量(在我们的例子中是试验)非常大时,Misztal(2008)建议使用贝叶斯方法通过吉布斯采样算法来估计方差分量。由于通过马尔可夫链蒙特卡罗(MCMC)算法进行后验推断的可行性,用于统计分析的贝叶斯理论已经在几个定量遗传学领域中变得流行。这些方法允许对每个单独参数进行边际推断,并通过检查后验分布直接通过方差或标准误差产生估计量的精确度量(Sorensen和Gianola 2002)。在具有加性关系矩阵和几个加性和环境协方差分量的多特征(或多环境)模型中,后验分布没有频率学派的对方法应:即,(协)方差参数(或它们的函数)没有小的采样分布。动物育种者已经使用MCMC技术如Gibbs取样来估计多性状动物模型中的(协)方差分量(例如,Van Tassell和Van Vleck 1996)。然而,来自多性状个体树模型的遗传参数的吉布斯抽样估计仍然很少(例如,Cappa和Cantet,2007),并且来自多环境个体树模型的估计甚至更少(Gwaze和Woolliams 2001)。 Gwaze和Woolliams(2001)拟合了一个多环境个体树模型,在试验之间使用非结构化的加性(协)方差矩阵,并为每个站点提供独立的误差方差,使用Gibbs抽样来确定最佳选择环境。然而,他们的方法并未考虑试验中的空间变异性。
      我们在本文中的目标是将Cappa和Cantet(2007)提出的单一森林遗传试验的空间分析方法扩展到MET设置,在2阶段方法使用具有加性和全同胞家族遗传效应的个体树模型。通过吉布斯采样的贝叶斯方法用于在模型的所有色散参数中进行推断。在两个系列的西部铁杉(Tsuga heterophylla(Raf。)Sarg。)的8个大型第二代全同胞试验中,来自483个家庭的34,143个后代的胎儿高度在10岁时得到了发展,其中涉及8个大型第二代全同胞试验。另外,最终将所提出的多环境空间个体树混合模型的所有色散参数的估计值与来自经典模型的相应估计进行比较,所述经典模型包括先验的“重复集合”或不完整的块α设计。

    2。材料和方法

    2.1遗传材料,交配设计和试验说明

    本研究中使用的西部铁杉(T. heterophylla(Raf)Sarg。)数据集起源于太平洋西北地区的全同胞第二代铁杉树改良合作社(HEMTIC)。这个第二代人口是通过重组最好的150个第一代父母组成的,即通过重组五个第一代计划中的每一个的前30名父母:来自俄勒冈州(OR)和华盛顿(WA)的两个父母和1个BC。使用了两种不同的交配设计:(1)“本地双列”(LD)系列,由五个六母不连接的部分(半)双列组成,代表上述五个程序中的每一个(两个来自OR和WA,一个来自BC) ),和(2)“精英双列”(ED)系列,由部分双列中的“最佳”30个父母组成(即,在第一代测试中排名的五个程序中的每一个的父母中最好的六个)。每个“最佳”父母与五个项目中的每一个的两个父母交叉。本研究中使用的这些第一代和第二代遗传物质的详细描述可以在King and Cress(1991),King等(1998)和Jayawickrama(2003)中找到。
    选择了8个HEMTIC全同胞后代试验,其中5个来自LD系列,3个来自ED系列,用于两阶段空间MET分析(表1,图1)。五个LD系列试验于1997年和1998年种植,三个ED系列试验种植于1999年。它们分布在太平洋沿岸,从华盛顿州到卑诗省温哥华岛的北端(即47~12)北纬50°34°,西经123°56至127°41,海拔45至380米;图1)。
    在五个LD系列试验中,成对位点之间的共同亲本数量从134到144不等,三个ED系列试验中共有30个。 LD系列有314到342个普通系列,ED系列有137到140个(表2)。然而,形成这两个系列的父母和家庭只是部分连接。 ED系列中的149个父母中只有30个也属于LD系列,ED系列只有15个普通系列(总共483个)与LD系列。一套“重复设计”设计(Schutz和Cockerham 1966;“S in R”),本地双列组中的家族组合在一起(“遗传组”),每个复制品包括所有组,用于LD系列。 ED系列的家族种植在一个不完整的块α设计中(Williams和Matheson 1994; ICB),其中30个重复和10个不完整的块在重复中。在所有试验中使用单树图。 5个LD系列试验种植在2?,2.5?.5和3?.5 m间距,3个ED系列试验间距为2.5?5 m(表1)。几乎所有测试站点都有两个检查批次;然而,这些数据并未用于空间MET分析的第一和第二阶段。在所有地点测量所有存活树木的10岁(TH,厘米)的总高度。得到的数据集由来自8个试验的34,143个子代高度观察组成(来自LD系列的23,473个和来自ED系列的10,670个)。

    2.2分析的统计模型

    • 2.2.1空间单环境分析的第一阶段统计模型
      在空间MET分析的第一阶段,估计了所分析的两个系列的每个位置的涉及立方B样条基的张量积的二维平滑表面。在这样做时,安装了具有二维平滑表面的单树混合模型,如Cappa和Cantet(2007)所述。与他们的个体树添加剂遗传混合模型的唯一区别是增加了随机全同胞家族遗传效应(对应于特定的组合能力; SCA)。

    因此,每个站点上安装的原始数据具有二维表面的单树混合模型包括:双列单元的固定效应(即遗传组; LD系列),整体位点平均值(ED系列)和随机效应添加剂(育种值)和全同胞家系效应(即SCA)。使用立方B样条基的张量积在每个位置处拟合二维表面(基质表示法,Bb)。矩阵B包含以立方B样条基数表示每个行和列所需的非零B样条基。参数向量b包含B样条基的张量积的参数。使用B样条基的张量积的二维表面(Bb)的更详细解释可以在Cappa和Cantet(2007,pp.2678-679)中找到。对于所分析的两个系列的每个位点,安装了具有不同行数和列数的三个模型(Cappa等人(未发表))。每个站点的最佳模型(即,捕获大部分空间变化的合适结节数)首先用于估计二维平滑表面,然后获得空间调整数据(如下一节所述)。

    • 2.2.2空间MET分析的第二阶段统计模型
      鉴于共同父母和家庭的数量较少,每个系列的不同现场设计,以及我们的总体目标是比较先验“S in R”和ICB设计的空间调整数据的多环境模型,MET分析 (即,空间和非空间)分别在每个系列中进行(即,对于LD和ED系列)。 因此,在每个系列中评估了具有加性和全同胞家族遗传效应的两种多环境个体树混合模型(即空间和非空间)。 在空间MET分析的第二阶段中,通过从原始数据中减去估计的平滑表面,获得每个站点处的每棵树的空间调整数据。 因此,在每个j站点yij处的树i的空间调整数据被计算为
      y_{ij}= \dot{y_{ij}}-(B\hat{b})_{ij}
      \dot{y_{ij}}是原始数据,(B\hat{b})_{ij}是从第一阶段估计的平滑表面。
      然后,通过将每个环境的观察集合考虑不同的特征并且分别在每个LD和ED系列内的五个和三个站点上组合分析来分析完整的多环境模型。 由于双列交配单元与LD系列中的亲本的地理起源混淆,因此在分析中包括遗传组或双列单元以解释程序之间的遗传差异和双列表之间的遗传取样效应。 先前的分析发现在LD系列的五个试验中遗传组之间存在显着差异。 因此,通过拟合LD和ED系列的多环境个体树混合模型分析单个树空间调整数据,在站点内部分双列单元(或遗传组)、和整体站点平均值作为固定效应。
      让下标j索引站点(j=1,...,s),i索引每个站点的树(i=1,...,gs),l索引站点s内的组(l=1,...,gs)。 令yijl是来自组l中得分的树i的空间调整数据。 aijl和fijl是位点j的加性育种值和个体(或家族)i的SCA,在第l组中得分。 然后,我们可以编写以下多环境个体树混合模型,该模型具有加性和全同胞家族遗传效应,用于空间调整数据(以下简称多环境空间模型):
      y = Xβ + Z_aa + Z_ff + e

    Var(a)=G_A \otimes AG_A是无结构方差协方差矩阵。
    Var(f)=G_FG_F=\oplus_{j=1}^s I_{nj}\sigma_{fj}^2是对角矩阵。残差的方差结构和f的类似。也假定协方差为0。

    2.3贝叶斯估计

    通过贝叶斯方法,Gibbs采样(Sorensen和Gianola 2002)估计模型(3)的所有分散参数。我们详细描述了所有参数的先验分布数据的似然值,以及空间调整数据的多环境个体树模型的联合和条件后验密度,因为这些是通过Gibbs采样进行后验推断所必需的

    • 2.3.1组合站点的先验分布和似然的规范

    继Cappa和Cantet(2006)之后的多性状个体树模型,我们选择使用共轭先验密度。在共轭方法中,选择所有参数的先验密度以在采样下闭合,这意味着先验和后验都属于相同的分布族。为了反映混合线性模型中固定效应的先前不确定状态,同时保持后验分布正确,\beta取为\beta \sim N_p(0,K),其中p是固定效应的数量。K是具有大元素的对角线矩阵(kii> 10^8,Cantet等2004),并且\beta(固定效应)的先验密度与以下成比例:
    p(\beta|K) \propto \lvert\Pi_{i=1}^p\rvert^{-\frac{1}{2}} exp{\lbrace-\frac{1}{2} \sum_{i=1}^p\frac{\beta_i^2}{k_{ii}}\rbrace}
    育种值
    p(a|G_A,A) \propto |G_A|^{-\frac{q}{2}} \cdot |A|^{-\frac{s}{2}} exp{\lbrace-\frac{1}{2} a^\prime G_A^{-1} \otimes A^{-1}a\rbrace}
    G_A服从逆Wishart密度G_A \sim IW(G_A^\ast, n_A),在贝叶斯设置中,G_A^\ast是超协方差,n_A是belief的自由度。
    p(G_A|G_A^\ast,n_A) \propto |G_A^\ast|^\frac{n_A}{2}|A|^{-\frac{n_A+s+1}{2}} exp{\lbrace-\frac{1}{2} tr(G_A^\ast G_A^{-1})\rbrace}
    f
    p(f|G_F) \propto |G_F|^{-\frac{f}{2}} exp{\lbrace-\frac{1}{2} f^\prime G_F^{-1} f\rbrace}
    G_F服从scaled inverted x^2密度:Inv-x^2(\delta_{f_j}^2, v_f
    p(\sigma_{f_j}^2|v_f, \sigma_{f_j}^2) \propto (\sigma_{f_j}^2)^{-(\frac{v_f}{2} +1)} exp{\lbrace{-\frac{v_f\delta_{f_j}^2}{2\sigma_{f_j}^2}}\rbrace}
    残差与家系一致:
    p(\sigma_{e_j}^2|v_e, \sigma_{e_j}^2) \propto (\sigma_{e_j}^2)^{-(\frac{v_e}{2} +1)} exp{\lbrace{-\frac{v_e\delta_{e_j}^2}{2\sigma_{e_j}^2}}\rbrace}
    似然函数:
    p(y|β,a,f,R) \propto |R|^{-\frac{1}{2}} \cdot exp{[{-\frac{1}{2}e^\prime R^{-1} e}]}
    e=y - Xβ - Z_aa - Z_ff

    • 2.3.2联合地点的联合和条件后验密度
      联合后验密度被写为表达式(10)和(4-9)的乘积,然后得到
      \begin{array}{l} p(β,a,f,G_A,G_F,R|y) \propto \\ |R|^{-\frac{1}{2}} exp{[{-\frac{1}{2}e^\prime R^{-1} e}]}\\ exp{\lbrace-\frac{1}{2} \sum_{i=1}^p\frac{\beta_i^2}{k_{ii}}\rbrace}\\ exp{\lbrace-\frac{1}{2} a^\prime G_A^{-1} \otimes A^{-1}a\rbrace}\\ |G_A|^{-\frac{n_A+s+q+1}{2}} exp{\lbrace-\frac{1}{2} tr(G_A^\ast G_A^{-1})\rbrace}\\ exp{\lbrace-\frac{1}{2} f^\prime G_F^{-1} f\rbrace}\\ (\sigma_{f_j}^2)^{-(\frac{v_f}{2} +1)} exp{\lbrace{-\frac{v_f\delta_{f_j}^2}{2\sigma_{f_j}^2}}\rbrace}\\ (\sigma_{e_j}^2)^{-(\frac{v_e}{2} +1)} exp{\lbrace{-\frac{v_e\delta_{e_j}^2}{2\sigma_{e_j}^2}}\rbrace} \end{array}
      为了利用关于任何参数的数据中的所有信息,关于a,f,GA,GF和R的推断基于它们各自的边际后验密度。 这些边际分布的有用特性是它们不依赖于其他参数的任何特定值。 因此,通过将联合分布(11)相对于感兴趣的参数之外的参数进行积分来获得每个边际密度。 这是通过使用称为吉布斯采样的MCMC程序来实现的,同时利用由(10)得到的边际条件密度对于采样是可行的。 对于具有加性效应的多性状模型,条件密度的获得见,如Van Tassell和Van Vleck(1996),Sorensen和Gianola(2002)以及Cappa和Cantet(2006)所示。 因此,对于模型(3)的\hat{\beta}\hat{a}\hat{f}中的线性参数,后验条件密度等于(略)。

    在Gibbs算法的任何迭代中,我们首先从分布(12),然后从(17),(14),最后从(16)采样,以使过程再次开始。 在FORTRAN中编写了一个程序来执行所有计算。 FORTRAN程序可根据要求从第一作者处获得。

    • 2.3.3计算细节,后验推断和模型比较
      G_A^\ast\delta_{f_j}^2\delta_{e_j}^2的对角元素的超方差值是使用经验贝叶斯方法从相同的空间调整数据集通过单个试验Gibbs采样与个体树模型估计的,包括遗传的固定效应 组(对于LD系列)和整体位点平均值(对于ED系列)和随机加性和全同胞家族遗传效应。使用软件包ASReml(Gilmour等人,2006)中实现的平均信息算法,利用来自相同空间调整数据的多环境个体树模型(3),获得加性协方差σ_{A_{j,j^{\prime}}}。 然后将belief自由度设定为10以反映相对较高的不确定性(Sorensen和Gianola 2002;第57页)。
      吉布斯采样每次迭代完成时,\tilde{σ}_{A_{j,j^{\prime}}}\tilde{σ}_{A_{j,j}}^2\tilde{σ}_{f_{j}}^2\tilde{σ}_{e_{j}}^2,按照下列式子参数化到加性遗传相关r_{A_{j,j^{\prime}}},显性方差{σ}_{D_{j}}^2以及单株狭义遗传力和广义遗传力:
      r_{A_{j,j^{\prime}}}=\frac{\tilde{σ}_{A_{j,j^{\prime}}}}{\sqrt{\tilde{σ}_{A_{j,j}}^2\tilde{σ}_{A_{j^{\prime},j^{\prime}}}^2}}
      σ_{D_{j}}^2=4 \times \tilde{σ}_{f_{j}}^2
      h_{Nj}^2=\frac{\tilde{σ}_{A_{j,j}}^2}{\tilde{σ}_{A_{j,j}}^2+\tilde{σ}_{f_{j}}^2+\tilde{σ}_{e_{j}}^2}
      h_{Bj}^2=\frac{\tilde{σ}_{A_{j,j}}^2+\tilde{σ}_{D_{j}}^2}{\tilde{σ}_{A_{j,j}}^2+\tilde{σ}_{f_{j}}^2+\tilde{σ}_{e_{j}}^2}

    4。讨论

    本文介绍了Cappa和Cantet(2007)方法的扩展,以解释多环境大型森林遗传试验的空间变异,该模型使用具有加性和全同胞家族遗传效应的多环境个体树模型在两阶段空间MET中分析。我们的方法不同于以前的工作(Ye和Jayawickrama 2008; de la Mata和Zas 2010),因为我们通过拟合多环境个体树混合模型和非结构化的加性遗传(协)方差矩阵来分析空间调整数据。试验,允许两个,每个试验的不同加性遗传方差和所有不同试验对的协方差(和相关性)。另外,所提出的多环境空间个体树模型也考虑了每个试验的家庭(即SCA)方差。 Ye和Jayawickrama(2008)拟合了一阶段和两阶段的家庭和个体树混合模型,在整个试验中具有共同的加性方差和协方差。然而,遗传(协)方差矩阵的不同遗传方差和协方差假设的假设可能导致遗传值的偏差预测不准确,从而可能影响选择决策和遗传增益估计(Costa e Silva et al 2005) 。使用两阶段方法,de la Mata和Zas(2010)使用家庭混合模型分析空间调整数据,该模型对试验中的遗传(协)方差矩阵具有不同约束,来自具有相同遗传方差的简单对角矩阵对非结构化家庭(协)方差结构的试验。与多环境空间个体树模型相比,多环境空间族模型通过减小要求解的方程组的大小来减少计算需求;然而,只有半同胞父母正在接受评估。
    在这里报告的分析中,使用贝叶斯程序成功估计了西部铁杉的八个大型第二代试验,每个系列中试验的加性遗传相关性,以及每个试验的加性,家族和误差方差以及这些估计的函数。加上马尔可夫链蒙特卡罗技术(吉布斯采样)。估算色散参数的另一种方法是使用受限制的最大似然程序(REML; Patterson和Thompson,1971)。然而,当每个站点的树木数量和站点数量很大时,使用平均信息-RTL算法计算试验中空间变异性的大型非结构化加性遗传(协)方差矩阵的参数估计变为计算困难(即未能收敛; Ye和Jayawickrama 2008; Ding等人2008)。 Ye和Jayawickrama(2008)强调了在一个阶段拟合单个树混合模型时的收敛困难,假设试验中的方差同质性,站点之间的独立误差方差和试验中行和列的可分离的二维AR(1)误差协方差结构,使用平均信息-REML。 Ding等人(2008)也使用平均信息算法拟合了具有加性和家族遗传效应的个体树模型,其中试验之间存在非结构化遗传协方差,站点之间存在独立的误差方差,以及可分离的二维AR(1)误差协方差试验结构来自12,460个人的数据,这些人来自169个地点的216到216个全同胞家庭的辐射松D. Don在五个地点。在一阶段过程中拟合空间模型时,他们也发现了收敛的麻烦。使用平均信息-REML算法,Hardner等人(2010)提出通过在一阶段空间分析中使用事实分析参数化来减少描述跨试验的家族(协)方差矩阵所需的参数数量。他们的因子分析成功应用于估计胸径的遗传参数,在21项试验中评估了总共841种桉树杂种家系的基因型。然而,Smith等人(2001)指出使用平均信息算法收敛这些因子分析模型的困难。 Misztal(2008)提出,对于复杂模型(即,众多特征和多个随机效应)和较差的起始值(即(协)方差分量的初始估计),平均信息算法可能“过冲”,导致非常慢收敛或参数估计位于参数空间之外。尽管贝叶斯方法在许多情况下具有更好的参数估计属性,但仍然难以比较频率论和贝叶斯估计量,因为与频率估计量(例如重复采样或偏差)的比较相关的中心问题不会在贝叶斯学派中具有相同的含义(Gelman等1995,第108页)。
    我们的研究结果表明,多环境空间模型拟合了的8个大型第二代全同胞子代后代试验。先验的“S in R”和ICB设计显示,相对于传统的多环境非空间模型,每次试验中估计的\sigma_e^2后验平均值(平均减少16.0%)持续减少。正如预期的那样,\sigma_e^2的这些减少证实了存在空间变化并未充分考虑先验设计效应。估计\sigma_e^2的减少与Ye和Jayawickrama(2008)的结果一致,他们在五个花旗松MET试验中平均减少了32.5%,Ding等人(2008)在五个辐射松试验中平均减少了1.3%。此外,在我们的数据中,对于\sigma_e^2的估计,多环境空间模型产生了精度的增加(即,95%高后密度区间的较窄值,平均增加18.8%)。当在多环境空间模型和常规MET分析之间进行比较时,在每个试验中估计的后验平均值\sigma_A^2显示没有一致的模式(即,减少和增加)。 Ye和Jayawickrama(2008)和Ding等人(2008)发现了类似的结果,他们分别报告了使用一阶段空间分析从-10.1%到34.3%和从-58.8%到14.8%的变化。多环境空间模型增加了hN2和h2B后验均值的平均估计值(平均而言,两个系列的所有站点分别为11.2%和18.5%),尽管这些估计显示系列之间的变化不一致。在LD系列的五个试验的每个试验中,对于所提出的空间MET分析估计的较高的个体树遗传力可能与相对于ED的LD(20.7%)获得的2e的估计的较高降低相关联( 8.9%)系列。
    Ye和Jayawickrama(2008)也发现了个体树遗传力的一致增长(从3.7%到65.4%)。有趣的是,我们的结果表明,预测育种值的平均准确度显示出难以区分的差异,并且在两个系列中父母,后代和家庭几乎没有重新排名。这与Ye和Jayawickrama(2008)报告的结果不同,其中MET数据的空间分析提供了比经典非空间模型更准确的育种值(父母的1%至20%和后代的1%至25%) 。

    多环境森林遗传试验数据对环境相互作用的空间分析对基因型的影响尚未得到广泛研究。对西部铁杉数据的分析表明,多环境空间个体树模型显示LD和ED系列中的两对位点之间的rAjj没有一致的变化。这些结果与Ding等人(2008)获得的结果一致,他们使用一步空间方法报告了对估计遗传相关性(变化范围从-15.4%到20.0%)的不一致影响,并且Ye和Jayawickrama(2008)展示了通过从传统(非空间)多环境到多环境空间模型的环境相互作用,基因型从4.3%降低到14.0%。
    虽然应用一阶段空间MET分析将结果与从建议程序获得的结果进行比较(即两阶段空间MET分析)在计算上是不可能的,但Ye和Jayawickrama(2008)比较了一阶段对二阶段空间MET的影响。 他们发现这两种方法对衍生参数具有相似的影响,如遗传力,育种值的准确性,育种值的等级相关性(0.99)和预测的遗传增益(差异<0.2%),并得出结论,两阶段分析是用于拟合大规则空间MET数据的合适方法。然而,他们报告说,在两阶段空间分析中,家庭与地点的相互作用略高于一阶段空间分析。 Cullis等(1998)比较了大麦品种田间试验中的一阶段和两阶段空间分析。在这种情况下,两阶段方法意味着在第一阶段期间为每个实验有条件地固定基因型效应以获得多样性平均值。然而,使用来自所有站点的数据,在分析的第二阶段中,基因型效应在所使用的混合模型中被认为是随机的。他们报告了一对二阶段空间分析的类似结果,除了两阶段的基因型*环境方差略高于一阶段分析。
    作为最终评论,无论是否能够通过试验之间的非结构化加性遗传(共)方差矩阵和通过试验的SCA方差完成两阶段空间MET分析,计算仍然是苛刻的。然而,随着台式计算机的计算能力的提高,诸如此处提供的分析以及具有非常大的森林遗传学试验数据的分析将变得更加普遍。

    5总结和结论

    考虑到必须考虑试验之间的遗传相关性和试验中的空间变异性,我们提出了Cappa和Cantet的单环境空间模型的扩展(2007)。我们开发了一个两阶段空间MET方法,用于分析大型森林遗传试验,使用具有加性和全同胞遗传效应的多环境个体树模型。先前使用两种方法进行空间MET分析的尝试受到更简单模型(即,不考虑树之间的加性关系)或跨环境的限制性遗传(共)方差结构的限制。通过重组前150名第一代父母形成的西部铁杉的八个大型第二代试验,使用10岁时的身高数据,经验性地说明了拟合更复杂的多环境大型森林试验模型的程序。虽然计算要求很高,但是通过吉布斯采样,使用贝叶斯方法从所提出的多环境空间个体树模型成功地估计了(共)方差参数(及其函数)。所提出的两阶段空间MET方法产生比常用的非空间MET分析更好的结果。空间调整数据的多环境个体树模型显示出后均值的一致且重要的减少以及2e的精确度的增加,以及hN2和h2B的后部平均值的平均增加。

    相关文章

      网友评论

        本文标题:Cappa2012 MET 单株模型 贝叶斯

        本文链接:https://www.haomeiwen.com/subject/wtdzqqtx.html