Piepho H-P (1999) Stability Analysis Using the SAS System. Agron J 91:154. doi: 10.2134/agronj1999.00021962009100010024x
使用SAS系统进行稳定性分析
摘要
通常分析多环境试验以评估基因型的产量稳定性。大多数常见的稳定性测量对应于具有固定基因型和随机环境的混合模型的参数。混合模型框架内的分析允许处理不平衡的数据【实际原因是混合模型估计参数的方法一般采用REML,基于似然估计,没有像ANOVA那样严格的前提】。本说明介绍了如何使用SAS系统的MIXED程序拟合最常见的稳定性模型。
产量稳定性是许多多环境试验分析中的一个重要方面。在实际工作中使用稳定性分析方法主要取决于易于使用的软件的可用性,该软件具有处理不平衡数据的设施。大多数常见的稳定性测量可以嵌入混合模型框架中,其中环境是随机因素并且基因型是固定的。模型参数可以通过限制最大似然(REML)来估计(Denis等,1997; Magari和Kang,1997; Piepho,1998a)。 REML的一个主要优点是它适用于不平衡数据。本文的目的是展示如何通过SAS procedure MIXED(SAS Inst。,1997)随时获得最常见稳定性测量的不平衡数据的混合模型分析。假设读者熟悉相关的混合模型和稳定性概念(Lin等,1986; Becket和L6on,1988; Denis等,1997; Piepho,1998a),因此本论文可以关注技术性在SAS中的实施。该评论涵盖了Shukla(1972)的稳定性方差,Finlay和Wilkinson(1963)以及Eberhart和Russell(1966)的回归模型以及环境变化(Lin al,1986)。给出了关于其他建模选项的提示:例如,所谓的加性主效应乘法相互作用(AMMI)模型的混合模型版本(Gauch,1988; Piepho,1997)。使用实际的不平衡数据集比较和例证这些方法(Denis和Baril,1992)。本文仅讨论双向数据的模型。在其他地方审查划分年份和地点影响的方法(Piepho,1998a)。
多环境数据通常可以作为复制数据或作为基因型 - 环境手段获得。本文讨论了两种形式的数据。
接下来的五个部分中给出的复制数据代码对随机完全区组实验的数据有效。数据可能以不同方式不平衡:即,缺少某些小区的数据,试验中重复数不同,和/或未测试某些基因型 - 环境组合。残差方差在整个环境中必须是同质的。如果设计与随机区组设计不同,则需要对设计效果(区组,复制,行和列等的效果)进行一些代码修改。或者,可以设置代码以适应建模绘图到绘图变化的空间分析。为简洁起见,这些修改并未详细说明。容易考虑异构误差方差,这将在本文后面讨论。
接下来的五个部分中的均值代码对于具有均匀误差方差的随机完全区组实验的数据是严格有效的。某些基因型 - 环境组合可能缺失,但每次试验的复制次数应相同,试验应平衡。在本文末尾讨论了在偏离这种简单情况的情况下对平均数据进行的两阶段分析。
稳定性方差模型
Shukla的稳定性方差模型用于随机完全区组设计的试验:
其中,是第
个环境中第
个基因型的第
个重复的产量,
是整体均值,
是第
个基因型主效应,
是第
个环境主效应,
是第
个环境中的第
个其中效应,
是第
个基因型 - 环境相互作用效应,
是对应于
的实验误差项。假定随机效应
、
、
和
是均值为0,方差分别为
、
、
(稳定性方差)、
的独立分布。
FINLAY-WILKINSON回归
可以编写Finlay-Wilkinson(1963)回归模型:
其中,是第
个基因型对潜在环境变量
的敏感性,
是随机偏差(无法解释的相互作用)。
和
的方差表示为
和
。Oman(1991)和Gogel等(1995)分别建议通过最大似然(ML)和REML拟合该模型。相乘项
过度参数化,因此需要施加可识别性约束。 在这里我们设置
(Piepho,1997)。 约束不同于更常见的要求
。这里使用约束
,因为它是在MIXED中实现的约束。强调无论使用何种约束,对
的解释都是相同的:具有大绝对值
的基因型显示对假设的基础变量的大敏感性
。 有关
解释的更多细节,请参阅Piepho(1998a)。
网友评论