Ober, U., Ayroles, J.F., Stone, E.A., Richards, S., Zhu, D., Gibbs, R.A., Stricker, C., Gianola, D., Schlather, M., Mackay, T.F.C., and Simianer, H. 2012. Using Whole-Genome Sequence Data to Predict Quantitative Trait Phenotypes in Drosophila melanogaster. PLoS Genet 8(5): e1002685. doi:10.1371/journal.pgen.1002685.
摘要
从基因型数据预测生物表型对于动植物育种、医学和进化生物学很重要。基于基因组的表型预测已应用于单核苷酸多态性(SNP)基因分型平台,但未使用完整的基因组序列。在这里,我们报告了果蝇饥饿的抗逆性和惊吓反应的基因组预测。使用约250万个SNP,这些SNP是通过对果蝇遗传参考小组自交系群体进行测序而确定的。我们从SNP数据构建了基因组关系矩阵,并将其用于基因组最佳线性无偏预测(GBLUP)模型中。我们通过交叉验证评估了预测能力,作为预测遗传值和观察到的表型之间的相关性,发现饥饿抵抗(惊恐反应)的预测能力为0.239±0.008(0.230±0.012)。具有内部SNP选择的贝叶斯方法BayesB的预测能力不大于GBLUP。选择具有最高绝对效应或方差的5%SNP并不能改善预测能力。仅当少于150,000个SNP用于构建基因组关系矩阵时,预测能力才会下降。我们假设该群体的预测能力来自于对引起的微妙关系结构的长幅度连锁不平衡的SNP的建模,而不是来自群体结构或具有因果关系的连锁不平衡中的SNP。我们讨论了这些结果对其他生物的基因组预测的影响。
作者摘要
从基因型数据准确预测复杂表型值的能力将彻底改变动植物育种,个性化医学和进化生物学。迄今为止,基因组预测已利用高密度单核苷酸多态性(SNP)基因分型阵列,但是序列数据的可用性为基因组预测方法开辟了新的领域。本文是在高等真核生物的大量样品中使用全基因组序列数据进行基因组表型预测的首次应用。我们使用来自“果蝇遗传参考小组”的基因组序列的约250万个SNP,其次要等位基因频率大于2.5%,来预测饥饿,抗性和惊吓引起的自发行为这两个特征的表型。我们系统地处理雌雄之间的预测,基因组最佳线性无偏预测(GBLUP)与贝叶斯方法的比较,以及SNP密度的影响。我们发现(i)通过GBLUP使用序列数据可以有效地进行基因组预测,(ii)如果SNP的数量增加到150,000以上,则预测能力几乎没有提高,并且(iii)隐性或显性标记选择均无明显改善预测能力。尽管必须在小样本量的背景下看待发现的结果,但结果说明了该方法的潜力和未来的挑战。
网友评论