美文网首页Animal Genetics
好的遗传估计的一些条件

好的遗传估计的一些条件

作者: Hello育种 | 来源:发表于2021-07-16 17:43 被阅读0次

1 构建适合性状的好模型

所有研究的先决条件,但是其也应尽可能的简单
依次有:单性状模型,多性状模型,随机回归模型(RRM,纵向数据,如产奶量和体重)
还有:UPG(未知父母组)作为随机效应,
但是:
在许多分析中,使用超过 2-3 个历史代不会影响最年轻一代(候选者)的 GEBV,甚至可能会改善它(Lourenco 等,2014)。 这是由于多种原因造成的,包括 1) 基因组预测的衰减,2) 性状随时间的变化,3) 固定效应随时间的不完善建模。 因此,限制计算的最简单方法之一是截断表型和谱系。 截断数据还限制甚至消除了对 UPG 的需求。
可以增加残差异质来完善模型。

2 选择合适算法来估计遗传方差组分(VCE)

(1)REML
传统的REML依靠稀疏矩阵完成,计算量大约是动物数量的二次方和性状数量的立方。
但是当性状数量太大或产生的协方差矩阵接近singularity时,可能会不收敛。

EM-REML 更稳定,但速度很慢,并且对 SE 没有很好的估计。 当缺失信息少时,EM-REML 速度更快。 如果起始参数很小,EM_REML 会被 RRM “卡住”。

AI-REML 对于简单的模型速度更快,但对于很复杂的模型,容易不能进行。

REML的特殊版本(eg: cannonical transformation)可以非常稳定且对于具有大量性状的分析要求内存小,但会增加模型的限制。

(2)使用Gibbs sampling 完成Bayesian分析
通过吉布斯采样 (BAGS) 的贝叶斯方法可能会变慢或变快,具体取决于优化(抽样数)。 通常所需样本的数量随着模型复杂度和参数数量的增加而增加。 例如,reduced动物模型可能需要比常规动物模型少 10 倍的样本。 并且分析 BAGS 的输出是必要的。

优化的 BAGS(例如 gibbs1f90 和更高版本)对非正定矩阵具有抵抗力,并且如果每个性状的模型差别不大,则可以非常快地处理大量性状。 复杂模型(例如阈值)通过 BAGS 比通过 REML 更容易实现。
(3)PCG法
此方法适用于国家数据的分析。因为模型更加复杂和数据更加多(千万级别),一般算法需要的运行内存太大,无法完成。就可以使用基于数据的迭代法,
通过“matrix free”或“iteration on data”方法计算解决方案,其中每轮迭代读取数据并重新创建混合模型方程的系数。 这些系数不会被存储,而是立即用于创建迭代方法使用的数量。 一种特别有效但易于实现的迭代方法是预条件共轭梯度(PCG, Tsuruta 等,2001)。 该方法可以以任意顺序使用混合模型方程的系数。

3 选择合适算法来预测育种值(EBV or GEBV)

现在育种中普遍使用ssGBLUP, 这样可以一步实现GEBV的估计,否则需要整合EBV和DGV,这两者预测都有误差,还需要选择合适的weight,这同样会增加误差。

ssGBLUP使用H矩阵:


image.png

ssGBLUP受到SNP频率P的影响

4 找出能一起作出上述2和3步骤的软件

现在有越来越多的可以使用,自己常用BLUPF90家族的软件。
其他的软件DMU,ASREML等也应用较广。
还有以下R包:更详细的请查看以下链接介绍:
https://www.cnblogs.com/jessepeng/p/14395909.html

3 5 验证方法
(1)具有很多记录的GEBV的可靠性
在具有高准确的male和大量后代的种群中,验证包括部分和完整的数据比较。 部分数据集排除了最年轻male的后代。 与用部分数据获得的 GEBV 或 EBV 和用完整数据获得的male的 EBV 或 DYD 进行比较。 当子代数量较多时,比较涉及PA+DGV-PP和PC。 GEBV 的分解表明这种方法何时合适。
(2)预测能力
当年轻动物的具有记录时,其真实可靠性为:corr(gebv, y-Xb)/h, gebv是没有表型时预测得到,h是遗传力的开方,但是当遗传力非常低时,可以使用corr(gebv, y-Xb)代替准确性(PS在小群体可能值非常低或者负值)。
(3)X-fold 交叉验证
当测基因型动物少时,可以使用交叉验证。但是当测基因型小群体的个体之间相关性很高时,会造成准确性估计过高,所以需要注意交叉分组

6 使用大量基因型数据的一步法

加入基因型数据后,REML利用的稀疏矩阵优势减少(具有了多个密集矩阵),可以使用YAMS算法进行遗传方差组分估计,对于复杂模型计算速度会提高至少20倍。

基因组数据中的群体可以使用小部分核心群体代替

相关文章

  • 好的遗传估计的一些条件

    1 构建适合性状的好模型 所有研究的先决条件,但是其也应尽可能的简单依次有:单性状模型,多性状模型,随机回归模型(...

  • 《酒品》

    我天生不胜酒力,这点遗传我爸。 我天生嗓音条件好,遗传我妈。 我妈能喝点,我爸貌似有点酒精过敏,喝完酒串皮,皮肤通...

  • 喜欢抬杠是病,性格使然

    性格决定命运,而性格中有很多似乎是好的,其实也可能是坏的。 但根据每个人的遗传基因,或者爹妈给的一些条件,最后决定...

  • 解读遗传参数估计文章

    看似花里胡哨的,其实重点就是根据表型值去估计遗传参数 1 试验数据描述 自伊犁某2个规模化养马场及参加伊犁马常态化...

  • 人过五十,力求四好

    心态好:命好气顺,福气自来 人的健康长寿15%取决于遗传,10%取决于社会条件,8%取决于医疗条件,7%取决于自然...

  • 杂交模型中遗传参数的最大似然估计

    from wu2006 Example 2.4 一个位点有2个allele——A和a,在F2子代中可构成3中基因型...

  • 10.30 健康与健康行为——每日健康

    据WTO(世界卫生组织)的界定,人类的健康和长寿, 40%依靠遗传和客观条件,其中15%为遗传,10%为社会 因素...

  • 今天我做了一条棉被

    现在这个年代,估计盖棉被的人已经不多了。经济条件好的,盖羽绒被,蚕丝被;条件差点儿的就是聚酯纤维的,总之棉花芯的被...

  • 【文魁大脑实用武林计划第三期】吴从严第2次

    1.影响多因素遗传病再发风险估计的因素 2.遗传咨询的定义目的步骤 3.如何化解焦虑情绪 4.亚洲的河流及其汇入的...

  • 漂亮是本色,活得漂亮全凭本事

    长得漂亮,感谢父母遗传的好。 活得漂亮,感恩自己奋斗的好。 长得漂亮是与生俱来,靠的是父母好的遗传基因强大,活得漂...

网友评论

    本文标题:好的遗传估计的一些条件

    本文链接:https://www.haomeiwen.com/subject/felbpltx.html