Howard, R., Carriquiry, A.L., and Beavis, W.D. 2014. Parametric and Nonparametric Statistical Methods for Genomic Selection of Traits with Additive and Epistatic Genetic Architectures. G3 (Bethesda) 4(6): 1027–1046. doi:10.1534/g3.114.010298.
摘要
为了预测表型,已经开发了参数和非参数方法。这些方法基于对由基因型和表型评分组成的经验数据的回顾性分析。最近的报道表明,参数方法无法用已知的上位遗传结构预测性状的表型【是这样的吗?能构建上位矩阵就可以估计】。本文中,我们回顾了参数化方法,包括最小二乘回归,岭回归,贝叶斯岭回归,最小绝对收缩和选择算子(LASSO),贝叶斯LASSO,最佳线性无偏预测(BLUP),贝叶斯A,贝叶斯B,贝叶斯C和贝叶斯Cp。我们还将回顾非参数方法,包括Nadaraya-Watson估计量,再现内核希尔伯特空间,支持向量机回归和神经网络。我们使用由自交系杂交衍生的F2群体中完全累加或双向上位相互作用组成的模拟遗传结构,评估了这14种方法在准确性和均方误差(MSE)方面的相对优势。每个模拟的遗传结构都解释了30%或70%的表型变异性。对准确性和MSE估计的最大影响是基因结构。当潜在的遗传结构完全基于上位性时,参数方法无法预测表型值。对于加性遗传结构,参数方法比非参数方法稍好。可加遗传结构的参数方法之间的区别是渐进的。遗传性,即表型变异性的比例,对准确性和MSE估计的影响最大。
网友评论