美文网首页遗传改良(育种)
Heslot2012 11种模型比较

Heslot2012 11种模型比较

作者: 董八七 | 来源:发表于2020-02-24 22:13 被阅读0次

    Heslot N, Yang H-P, Sorrells M E, et al. 2012. Genomic Selection in Plant Breeding: A Comparison of Models. Crop Science, 52(1): 146.

    摘要

    基因组选择(GS)的模拟和实证研究表明,准确度足以产生快速的遗传增益。然而,随着GS方法的日益普及,已经提出了许多模型,并且没有比较分析来确定最有希望的模型。利用8个小麦(Triticum aestivum L.)、大麦(Hordeum vulgare L.)、拟南芥(Arabidopsis thaliana(L.)Heynh.)和玉米(Zea mays L.)数据集,通过比较准确度、基因组估计育种值(GEBVs)以及每个模型的标记效应,评估了当前可用的GS模型以及几种机器学习方法的预测能力。虽然在许多模型中观察到了类似的精度水平,但过度拟合的水平以及计算时间标记效应估计的分布【标记效应分布是什么?怎么比较?】也有很大的不同。我们的比较表明,植物育种计划中的GS可以基于一组简化的模型,如Bayesian套索、加权Bayesian收缩回归(wBSR,BayesB的一个快速版本)和随机森林(RF)(一种能够捕捉非加性效应的机器学习方法)。对不同模型的线性组合以及bagging 和boosting方法进行了测试,但没有提高准确性。这项研究还表明,在一个数据集内,不同亚群之间的准确度存在很大差异,而这种差异并不能总是由表型方差和样本量大小的差异来解释。这里测试的经验数据集的广泛多样性增加了GS可以增加每单位时间和成本的遗传增益的证据。

    基因组选择(GS)的概念包含了广泛的方法。它们的共同特点是能够通过一步同时估计标记效应来估计基于全基因组基因型的数量性状的育种值。这一概念最早由Meuwissen等人(2001年)和一些新的统计模型一起提出。此后,又提出了进一步的模型。模拟和实证研究表明,GS可以大大加快育种周期,保持育种计划内的遗传多样性,并增加遗传增益,超出表型选择或数量性状位点(QTL)方法的可能。然而,重要的是要确定最佳方法和统计程序,以使用高通量分子标记技术和以前可用的表型记录,加速单位时间和单位成本的遗传增益。最近有一些关于GS在植物育种中的研究,特别是Heffner等人(2009年)、Jannink等人(2010年)、Xu和Hu(2010年)以及Lorenz等人(2011年)。
    对于所提出的模型在植物或动物中的比较预测能力,目前还很少有广泛的研究。Lorenzana和Bernardo(2009)表明,在双亲种群的情况下,他们测试的模型(岭回归和经验Bayes[E-Bayes][Xu,2007])的预测能力相当相似。Heffner等人(2011)比较了多熟小麦(Triticum aestivum L.)群体预测能力的几种模型。Crossa等人(2010)关注于贝叶斯套索(BL)和再生核希尔伯特空间(RKHS)模型,以评估小麦和玉米(Zea mays L.)改良的GS。我们在这项研究中的目标是彻底比较迄今为止公布的所有模型,以及之前没有评估过的几种机器学习程序,使用相同的评估方法对几个物种、性状和数据集进行评估。此外,上述模型比较研究均未衡量各模型的过度拟合程度,这也是量化的重要因素。还应强调的是,在给定的精度水平下,模型对QTL效应分布采用不同的假设,从而产生不同的标记效应分布。因此,即使它们具有相同的预测能力,两种模型也可能给出不同的基因组估计育种值(gebv),并沿基因组施加不同的选择压力。我们的目标是确定最有希望的模式,为在育种计划中实施GS方法提供一些建议,并获得模式相似性和不同性的经验证据。
    使用了几种标记。多样性阵列技术标记(DArT)为显性标记,单核苷酸多态性(SNP)和简单序列重复序列(SSR)为共显性标记。缺失标记数据作为每个标记水平的非缺失数据的平均值。

    相关文章

      网友评论

        本文标题:Heslot2012 11种模型比较

        本文链接:https://www.haomeiwen.com/subject/knbaxxtx.html