![](https://img.haomeiwen.com/i24959989/1ea12605f6b5ebd4.png)
十年前的基因型:
![](https://img.haomeiwen.com/i24959989/3f34bedbc8525da3.png)
全基因组序列:
![](https://img.haomeiwen.com/i24959989/bc93e06153fdbe8e.png)
2010序列的假设:
![](https://img.haomeiwen.com/i24959989/d87becc2d84a1fbc.png)
公牛1000Genomes项目的起源:
![](https://img.haomeiwen.com/i24959989/a7282c4eebf32a43.png)
为什么要实施:
![](https://img.haomeiwen.com/i24959989/5e76ce09a58fc95f.png)
目前的项目的实施:
![](https://img.haomeiwen.com/i24959989/28d4cf7340c2addc.png)
注意可以使用Beagle VCF工具
目前的数据:
![](https://img.haomeiwen.com/i24959989/60e83025a6dbc164.png)
品种组成,许多样本来自欧洲:
![](https://img.haomeiwen.com/i24959989/9d627f51dbfd562d.png)
较多的来自西门塔尔牛。
项目的应用
![](https://img.haomeiwen.com/i24959989/d04a97785471b8e8.png)
填充
影响条件:
![](https://img.haomeiwen.com/i24959989/6470aa899740a4ec.png)
提高填充的准确性:
超高50%的测序variant 的maf< 0.1
![](https://img.haomeiwen.com/i24959989/d0e01dfbf7b7ec95.png)
填充的好处:
![](https://img.haomeiwen.com/i24959989/be482e37ede8c273.png)
多样性-群体遗传
![](https://img.haomeiwen.com/i24959989/00f620862424a937.png)
线粒体多样性:
![](https://img.haomeiwen.com/i24959989/0629dd543fa01869.png)
寻找causative突变
质量和数量性状
![](https://img.haomeiwen.com/i24959989/5fe8867bcbd18ce2.png)
单基因变异(质量性状)
![](https://img.haomeiwen.com/i24959989/ed4f644a0177f7fc.png)
数量性状
![](https://img.haomeiwen.com/i24959989/cc48359dd89cbd96.png)
meta-GWAS;对于牛的stature
![](https://img.haomeiwen.com/i24959989/84d5a325618395e9.png)
致因突变的发现学习:
![](https://img.haomeiwen.com/i24959989/0f04b915187fefbd.png)
整合genenotype
![](https://img.haomeiwen.com/i24959989/383ae0bf11146461.png)
QTL mapping寻找的例子
![](https://img.haomeiwen.com/i24959989/82f18e6acae33df5.png)
具有使用:牛stature发现IGF2BP3
![](https://img.haomeiwen.com/i24959989/f10f1db4de4d3688.png)
GP基因组预测
使用发现:
![](https://img.haomeiwen.com/i24959989/b7ee4b83b469cdc9.png)
如功能突变,提高50K芯片的准确性
![](https://img.haomeiwen.com/i24959989/1c921a13aa2c11c0.png)
使用例子:
![](https://img.haomeiwen.com/i24959989/a8d10f594189e5a6.png)
功能variant 选择
![](https://img.haomeiwen.com/i24959989/832d63ebae5b6bfb.png)
得到新XT-50K芯片:
![](https://img.haomeiwen.com/i24959989/212f8963c05ea4ac.png)
对其进行验证:
数据:
![](https://img.haomeiwen.com/i24959989/19c8d978493c9f90.png)
结果:
![](https://img.haomeiwen.com/i24959989/54585e8a75254dac.png)
variant优先性二(600K):
![](https://img.haomeiwen.com/i24959989/5acf6c3ab23403cc.png)
验证数据:
![](https://img.haomeiwen.com/i24959989/9d8c9904b8f3a4b5.png)
GS应该做法对全部序列数据:
![](https://img.haomeiwen.com/i24959989/704d7cd79f2e8bcc.png)
下一步思考
![](https://img.haomeiwen.com/i24959989/7ee9f8349ff0cf97.png)
总结
![](https://img.haomeiwen.com/i24959989/28b8511cd5a7d6da.png)
问答环节
1 公牛精液中线粒含量问题?
测序时,公牛精液中线粒含量比较大,需要使用后续技术进行去除,但是不能完成去除。
2 没南美洲的数据加入
3 选择50K的原因?为什么不对每个品种选择特殊的位点?性状是否也单个分析?
50K是检测成本决定;应该使用多品种参考群,这样能够进行数据填充,更好进行GWAS工作;
使用了meta-GWAS对于多性状,应该进行考虑单个性状。
4 数据填充准确性?
在taurus中,最好的参考群体时,是能代表你的群体的参考数据
5 功能性状使用在其他其他国家?
大多数据来自澳大利亚,但是已经在新西兰和德国进行了验证,准确性是可以,美国也是。
6 bayesina alphabet模型能提升GS的准确性多大?有意义吗?
大概提升了2%, 但是需要提高,不需要放弃。
全但是对于序列的数据可能更有利于对多个世代或者相关性小的个体进行基因组选择育种;
应该尽可能找到引起突变的位点,利用先验信息的贝叶斯方法更好的预测。
7 预测准确性的相关性在不同国家?
最大相关为0.5,仍然需要增加。
8 非遗传部分是否有加大的影响?
GP进行时,受到3部分影响:
(1)你的参考群体的基因的代表性
(2)验证群英语参考群体的相关性
(3)动物的基因的效应一定都相同吗,不一定,尤其是在多个群体时, 可能使用BayesR更好点,更容易使一个结果用于另一个群体或世代的预测
GXP时,我们没有相关基因型的个体在不同的环境中
网友评论