去回归是一种去除方差异质性的方法,在某类数据处理时偶尔用到,比如估计基因组选择育种值时。借着文献Thistlethwaite2019[1]来学习一下DEBV是怎么计算的。
该方法首次由Garrick等(2009)[2]提出,做法是将去回归育种值而不是实际表型值进行加权并用作WGP模型中的响应变量,达到降低偏差并提高可靠性的目的。在某种程度上,可以认为对加权去回归育种值的建模是考虑异质方差的方法,在这里就是是育种值的方差。 然而,这种方法可能是临时性的,因为其有效性取决于若干因素,例如重复测量观测的数量、训练数据的大小和育种值的可靠性[3]。
使用Garrick等(2009)[2]提出的“去除亲本平均效应”方法,去除了EBV并去除了亲本平均值。得到的去回归估计育种值(DEBV)用作GS分析的替代表型。 这种类型的去回归数据可以通过近似和反向求解评估方程获得:
式中PA和EBV分别代表亲本均值和估计育种值向量;和分别代表PA和个体相关的右侧元素的等价信息;;和分别表示亲本平均值的未知信息内容,以及没有亲本平均值的个人效应值。后面这2项可以等同于首先求解方程(2)并使用结果求解方程(3):
式中,。定义为具有亲本“父本”和“母本”的个体i的PA的可靠性,可以通过计算。EBV的可靠性是真实和预测育种值相关性的平方:
式中是个体的预测误差方差(PEV);是个体的近交系数;是加性遗传方差。
现在可以使用方程(2)和(3)完成并求解系数矩阵(方程(1)),并将其乘以向量PA和EBV。使用此简化公式可获得有关没有PA效应的个体的去回归信息:
实现步骤:
- 先得到,和遗传力,在ASReml中拟合含有双亲的单株模型,然后用
predict()
应该能得到双亲及个体的,待验证。
- 先得到,和遗传力,在ASReml中拟合含有双亲的单株模型,然后用
- 计算间接参数,和。
- 计算公式(2)的左手边,代入公式(3)同样计算左手边。
- 通过公式(1)就能得到,然后代入公式(5)即得到DEBV。
参考文献
-
Thistlethwaite FR, Ratcliffe B, Klápště J, et al (2019) Genomic selection of juvenile height across a single-generational gap in Douglas-fir. Heredity. doi: 10.1038/s41437-018-0172-0 ↩
-
Garrick DJ, Taylor JF, Fernando RL (2009) Deregressing estimated breeding values and weighting information for genomic regression analyses. Genet Sel Evol 41:55. doi: 10.1186/1297-9686-41-55 ↩ ↩
-
Ou Z, Tempelman RJ, Steibel JP, et al (2016) Genomic Prediction Accounting for Residual Heteroskedasticity. G3 (Bethesda) 6:1–13. doi: 10.1534/g3.115.022897 ↩
网友评论