1 Genomic evaluation of cattle in a multi-breed context.2014.(https://doi.org/10.1016/j.livsci.2014.05.008
)
摘要:
为了获得准确的基因组育种值,需要大量具有表型和基因型数据的参考动物。这对参考种群较小的品种提出了挑战。克服这一障碍的一种选择是使用多品种参考种群。然而,由于连锁不平衡结构的差异和品种之间的弱关系,跨品种组合种群并不简单。本研究回顾了有关使用从不同牛品种编制的参考种群的可用文献。
结果表明,多品种参照种群对基因组预测准确性的影响受品种间遗传距离的影响很大。当组合来自不同国家的相同品种的种群时,可以看到准确度有很大提高,而对于一些交换公牛的混合种群,发现了大量但较小的收益。将远亲品种(如荷斯坦和泽西岛)结合使用并使用广泛使用的基因组 BLUP 模型时,几乎没有或根本没有发现任何好处。通过使用更复杂的贝叶斯变量选择模型,将更多的注意力放在与致病变异的强连锁不平衡中的基因组标记上,并结合更密集的标记集或标记的功能子集,但是可以利用远缘品种的信息来提高准确性基因组预测。
多品种基因组预测模型的进一步发展不仅提高了小品种基因组育种值的准确性,而且还将在较大品种中提供更持久的准确性。
统计模型
(1)单性状GBLUP
多品种预测最直接的方法是应用常规的单性状 GBLUP ( VanRaden, 2008 )。当种群相对接近时,例如同一品种的亚种群,这种方法主要是明智的。GBLUP 运作良好的先决条件是拥有许多最近的关系,即使用大量的共同父系或祖系。GBLUP 用于汇集跨品种数据的一个限制是跨品种的关系通常很小。当这些关系变得非常小时,因果位点的基因组关系与从全基因组标记计算的基因组关系之间的相关性变得非常低(De Los Campos 等,2013)。因此,它们本质上会变成“噪音”,并可能导致估计问题。
(2)多性状GBLUP
当在不同品种中测量的表型被认为是不同的性状时,可以使用多性状 GBLUP 模型(Olson 等,2012;Zhou 等,2013)。这种方法可以适应不以完全相同的方式测量的表型,适用于群体(遗传背景)相互作用的可能 SNP 和环境相互作用的 SNP。
然而,一般来说,这种多性状 GBLUP/SNP-BLUP 模型的局限性仍然是假设整个基因组的协方差是一致的
(3)贝叶斯方法
贝叶斯变量选择方法的应用有可能以两种方式改善多品种评估。首先,由于贝叶斯变量选择方法将更多的基因组方差分配给与表型高度相关的标记,它们可能能够更好地分离基因组预测中的连锁和 LD 贡献。因此,预测因子更多地基于 LD,这有望改善跨种群或品种的信息共享。其次,贝叶斯方法可以减轻 GBLUP 方法中的强烈假设,即 SNP 方差和协方差在整个基因组中是一致的。当标记和致病变异之间的 LD 阶段在组合品种中不同或致病变异仅在其中一个品种中分离时,这将是一个很大的优势。
参考群构建
奶牛
(1)不同群体的同品(or 不同品)种奶牛(or 来自不同国家):GBLUP算法使用较多
(2)杂交群体
(3) 亲缘关系更远的品种的种群
肉牛
BayesC 或 BayesCπ使用较多
根据自身和加入参考群大小对准确性的提高
结合混合或远缘动物的参考数据时,准确性的提高取决于品种内参考种群的大小。
将澳大利亚 HF 和泽西牛结合使用时,HF 几乎没有或没有收益(Hayes 等人,2009 年,Erbe 等人,2012 年),而随着标记密度增加或贝叶斯方法的使用,泽西牛看到了增加(Erbe 等人,2009 年,Erbe 等人,2012 年)
当结合北美 BS、Jersey 和 HF 动物时,也看到了最大的增益对于最小的品种,即 BS。
霍泽等人。 (2014) 在一项对法国诺曼底动物的研究中调查了自身参考大小的影响,这些动物被用于多品种基因组预测方案,具有不同大小的品种内参考数据。 结果表明,对于少量 Normande 动物 (N=200,400),将 Holstein 和 Montbéliarde 动物添加到参考中的好处比使用更多个体参考时 (n=1600) 更大(3% 对 0.5%)。
根据上述研究结果,如果试验动物与品种内参照动物之间的关系较弱,则组合参照种群相对于单一品种参照种群的优势较大,反之亦然。
3 不同的基因型模型和标记密度
结果证实,更先进的模型,更加强调标记和致病变异之间的强 LD,对于多品种预测效果更好。
讨论观点
从所呈现的结果中可以明显看出,将相同或密切相关品种的参考种群结合起来是提高 GEBV 准确性的有效方法。对于远亲品种,标记与致病变异密切 LD 并且预测方法试图将预测集中在这些标记上是至关重要的。尽管到目前为止几乎没有结果,但有迹象表明,将大部分基因组变异分配给具有致病变异的强 LD 中的标记的贝叶斯变量选择模型在预测跨品种的 GEBV 时是有益
2 Genomic selection in multi-breed dairy cattle populations.2016. https://doi.org/10.1590/S1806-92902016000400008.
多品种模型是单品种基因组模型的扩展,其中使用基因组关系矩阵来解释群体中等位基因的品种起源,以及品种之间的等位基因频率差异。大多数研究发现,对具有大量参考种群的纯品种进行多品种评估几乎没有什么好处。然而,参考种群较小的品种可能会受益于包含在多品种评估中,而不会对纯种性能的评估产生不利影响。
LD 阶段的一致性对于基因组选择以及群体中的 LD 数量非常重要。跨品种和多品种基因组预测的准确性受种群之间 LD 阶段一致性的影响。表征不同猪群的LD模式。
单步 GBLUP 方法 (ssGBLUP;Misztal 等人,2009 年; 阿吉拉尔等人,2010 年),这允许同时估计 SNP 效应和 GEBV。
3 Optimizing genomic prediction for Australian Red dairy cattle(https://doi.org/10.3168/jds.2019-17914
)
摘要:
基因组预测的可靠性受多种因素影响,包括参考种群的大小,这使得对种群规模相对较小的品种(例如澳大利亚红奶牛)进行基因组预测具有挑战性。在参考种群中包括其他品种可能有助于增加参考种群的规模,但基因组预测的可靠性也受到参考种群和验证种群之间的相关性的影响。
目标:是优化澳大利亚红奶牛基因组预测的参考种群。
数据:参考种群包括多达 3,248 头荷斯坦奶牛、48,386 头荷斯坦奶牛、807 头泽西奶牛、8,734 头泽西奶牛和 3,041 头澳大利亚红牛,并使用了 208 至 224 头澳大利亚红牛的验证种群,并记录了牛奶、脂肪和蛋白质产量、体细胞计数、生育力和存活率。
方法:实施了三种不同的分析:单特征基因组最佳线性无偏预测器 (GBLUP)、多特征 GBLUP 和单特征贝叶斯 R,使用 2 个不同的中等密度 SNP 面板:标准 50K 芯片和定制的变体阵列预计会因致病突变而富集。构建了各种参考种群,包含澳大利亚红牛和所有荷斯坦和泽西公牛和母牛、所有荷斯坦和泽西公牛、所有荷斯坦公牛和母牛、所有荷斯坦公牛,以及荷斯坦牛和澳大利亚红牛之间不同关系的荷斯坦个体的一个子集和荷斯坦牛的数量。
结果:
(1)改变参考人群和验证人群之间的相关性只会导致可靠性的微小变化。
(2)与品种内预测相比,添加有限数量的密切相关的荷斯坦犬增加了可靠性,而增加荷斯坦犬的数量会降低可靠性。
(3)将不同品种中的相同性状视为相关性状的多性状 GBLUP 比单性状 GBLUP 产生更高的可靠性。
(4)贝叶斯 R 产生的可靠性低于多特征 GBLUP,并且在更大的参考人群中表现优于单特征 GBLUP。
我们的结果表明,增加多品种参考种群的规模可能会导致参考种群由一个品种主导,并降低对其他品种进行预测的可靠性。
网友评论