1 研讨会回顾:奶牛的单步基因组评估
此文来自综述: Symposium review: Single-step genomic evaluations in dairy cattle.(Mäntysaari et al., 2020)
背景:
在过去十年中,基因组选择彻底改变了奶牛育种。例如,出生于 2018 年的北欧奶牛(丹麦、芬兰和瑞典)> 90% 是由经过基因组测试的年轻公牛配种的。因此,2018 年出生的红奶牛母牛的平均公牛年龄仅为 3.1 岁,而 2011 年为 5.7 岁。早些时候,遗传进步的关键驱动因素是选择经过后代测试的公牛,但现在是年轻公牛的基因组预选。这导致传统遗传评估对遗传进展的估计有偏差。
问题:
当这些被用作多步基因组评估的输入时,它们也会被扭曲。保持公正性的唯一长期解决方案是在评估中包含基因组信息。 2010年虽然引入了单步评价模型的手段,但尚未在大规模的全国乳品评价中实施。起初,单步评估受到计算成本的阻碍。这已经在很大程度上解决了,或者通过稀疏表示基于 G (ssGBLUP) 的单步评估模型中所需的基因分型动物的基因组关系 (G) 和谱系关系 (A22) 矩阵的逆矩阵,或者通过使用单个-步标记模型。 G-1 的方法是 APY-G,其中“年轻”动物之间的关系完全取决于它们与“核心”动物的关系,以及单步评估,其中 G-1 被基于计算公式取代G的结构(ssGTBLUP)。
单步标记模型
单步标记模型包括标记效应,或者直接作为统计模型中的效应,或者间接地在基因分型动物之间产生基因组关系。随着算法的发展,计算资源在计算机内存的可用性和速度方面都得到了发展。现在积极研究的问题对于两种单步方法(GBLUP 和标记模型)都是相同的。随着基因型数量的增加,迭代求解的收敛性似乎变得更糟。这些问题在低遗传性状和性状间具有高遗传相关性的多性状模型中更为明显。
问题还与谱系和不同遗传群体的不平衡有关。在许多情况下,可以通过适当考虑基因型动物对基因组的贡献来解决问题。标准求解方法是预处理共轭梯度迭代,其中通过更好的预处理矩阵提高了收敛性。
另一个需要考虑的困难是候选动物基因组评估的膨胀;基因组模型似乎高估了基因组信息。单步评估中的问题通常比多步评估中的问题小,但更难以通过临时调整来缓解。
总结:
基因组评估原则是在 10 多年前引入的,目前,基因组选择是全球奶牛遗传改良的主要来源。因为这种选择不能归因于母牛记录或公牛子代平均值中的选择,所以它不会被基于谱系的遗传评估所捕获。因此,EBV 开始变得越来越有偏见。目前,2015 年出生的公牛正在获得他们的第一个后代测试结果。这些公牛及其公牛是根据基因组评估预先选择的。为了确保未来评估的公正性,唯一的选择是开始将基因组信息纳入国家评估。这可以使用单步评估方法来完成。
在过去十年中,基因分型也已成为选择母牛替代者的日常工具。许多国家还对母牛进行基因分型,目的是增加基因组评估的参考人群。最终目标可能是对所有动物进行基因分型。同时,国家遗传评估必须能够处理所有非基因型动物以及逐渐增加的基因型动物数量。在引入单步基因组评估模型时,人们担心应用程序会对评估中可以包含多少基因型有上限。使用当前的单步技术,计算成本与基因分型的动物数量成线性关系;因此,该算法能够处理任何规模的奶牛种群。具有基因组关系的单步模型可以使用 ssGTBLUP(Mäntysaari 等,2017)或单步 APY GBLUP(Misztal 等,2014)解决。或者,可以使用各种基于标记效应的模型进行计算。最有前途的标记模型方法是混合 ssHM(Fernando 等人,2016 年),如果证明收敛性令人满意,那么具有增强 SNP 效应和 RPG 的模型(Liu 等人,2014 年)。
当基因组模型基于所有标记具有相同先验方差的高斯假设时,基于 G 和基于标记的单步模型的差异并不大,特别是如果假设和拟合剩余多基因效应。如果将来可以为不同的 SNP 效应赋予不同的权重,或者在多性状模型中为不同的性状拟合不同的 SNP,那么 ssMEM 模型比依赖于基因组关系矩阵 G 的方法具有明显的优势。
单步评估被指责高估了育种价值的差异。尽管在多步评估中对某些动物的过度预测很容易纠正,但单步评估被认为是在种群中进行的唯一评估。为了育种计划的成功运行,评估应公平地对动物进行排序,无论是年轻的还是年老的,有或没有基因组信息,有或没有表型信息。对于选择目标中的关键特征,过度预测或过度分散最为严重。不幸的是,这些也是最迫切应该实施单步评估的特征。正在深入研究这种偏差,希望能找到“打折”基因组信息的通用解决方案。
2 未知父母分组和metafounders在ssGBLUP应用
此文来自综述:Invited review: Unknown-parent groups and metafounders
in single-step genomic BLUP. (Masuda et al., 2021).
介绍:
单步基因组 BLUP (ssGBLUP) 是一种基因组预测方法,它将谱系 (A) 和基因组 (G) 关系矩阵整合到一个统一的加性关系矩阵(H矩阵)中,该矩阵的逆被合并到一组混合模型方程 (MME) 中以计算基因组预测。
问题:
奶牛的谱系信息通常不完整。缺少谱系可能会导致使用 ssGBLUP 获得的基因组估计育种值 (GEBV) 出现偏差和膨胀。
三个主要问题与 ssGBLUP 中的谱系缺失有关,即选择的有偏预测、谱系关系中的近亲繁殖缺失以及 G 和 A 在水平和尺度上的不相容性。
解决方案:
这些问题可以使用适用于未知父组 (UPG) 的适当模型来解决。使用 UPG 背后的理论对于谱系 BLUP 已经很好建立,但对于 ssGBLUP 则不然。本研究回顾了谱系 BLUP 中 UPG 模型的发展、ssGBLUP 中 UPG 模型的特性,以及 UPG 对遗传趋势和基因组预测的影响。
还回顾了 UPG 和元创始人 (MF) 模型(一种广义 UPG 模型)之间的异同。
使用 MME 的变换导出的 UPG 模型 (QP) 具有良好的收敛行为。然而,由于数据不足,QP 模型可能会产生有偏见的遗传趋势,并可能低估 UPG。 QP 模型可以通过从 MME 中删除连接 GEBV 和 UPG 效应的基因组关系来改变。与 QP 模型相比,这种改变后的 QP 模型在遗传趋势上的偏差较小,在基因组预测中的膨胀较小,尤其是在大数据集的情况下。最近,在模拟纯种种群中提出了一种新模型,该模型将 UPG 方程封装到基因分型动物的谱系关系中。
MF 模型是对缺失谱系问题的综合解决方案。如果数据集允许估计 MF 的合理关系矩阵,则该模型可以作为多品种或杂交评估的选择。
缺少谱系会影响遗传趋势,但当许多经证实的公牛进行基因分型时,其对基因分型动物遗传价值可预测性的影响应该可以忽略不计。
SNP 效应可以使用来自年长基因型动物的 GEBV 进行反向求解,并且这些预测的 SNP 效应可用于计算缺少父母的年轻基因型动物的 GEBV。
网友评论