这里有一份群体的学习课程,这篇推送主要基于这个作为参考,
群体课程
Fst值
以下例子来自于:Fst值
Fst值
在群体里面Fst是衡量种群分化程度,取值从0到1,为0则认为两个种群间是随机交配的,基因型完全相似;为1则表示是完全隔离的,完全不相似
data:image/s3,"s3://crabby-images/b68ca/b68ca9ae34ac2abee23a0a1b5e689f3237c63932" alt=""
1计算各等位基因的频率
对于某一个基因的等位基因(位点)来说,分别统计各物种AA,Aa和aa的数量,然后计算各等位基因的频率
data:image/s3,"s3://crabby-images/8bdae/8bdae07b976a8c68cfb6e025fe2075c1acd5542c" alt=""
分别计算p1和q1的基因频率
2利用哈温平衡二项式预测基因型频率期望
data:image/s3,"s3://crabby-images/d0c8f/d0c8ffd2f576b8ed94e6447392d438446d3a8585" alt=""
然后可以利用期望和实际做对比
3计算每个亚群实际观察到的杂合度
data:image/s3,"s3://crabby-images/71529/715295c59cc218e40d715e26effa30694f44d057" alt=""
4计算每个亚群实际杂合度的期望
根据公式:
data:image/s3,"s3://crabby-images/23aa1/23aa1af565732232531634bcea90338d05c8d1e8" alt=""
data:image/s3,"s3://crabby-images/9dbce/9dbce2d9a31fc6715a24bd194e912738a072ccf4" alt=""
5计算每个亚群的近交系数
利用卡方测验的思想,我们有:
data:image/s3,"s3://crabby-images/6e00b/6e00b8b7eb4a61e2321ec9de9459ea144ad8ac0e" alt=""
data:image/s3,"s3://crabby-images/17a9c/17a9cb5e8e12efe43cbc1c4f076f637db1e57626" alt=""
6在全基因组范围计算基因频率
data:image/s3,"s3://crabby-images/573f0/573f0f01b4e869e712a8ca0dc50e7a8c4bc2d1f6" alt=""
7计算三种杂合性指数
data:image/s3,"s3://crabby-images/d7f94/d7f94c9b7abbadc429dd79bc5003595ee6fcdc80" alt=""
8计算Fst值
接下来就直接计算相应的值即可
data:image/s3,"s3://crabby-images/95021/9502179648e4a27492b0e986ccec2d580ef558e0" alt=""
Fst值如图所求
计算Fst值的软件
一般首推vcftools,我们根据两个亚种的vcf文件进行比较:
##对每一个SNP变异位点进行计算
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2—single
##按照区域来计算
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2_bin --fst-window-size 500000 --fst-window-step 50000
# test.vcf是SNP calling 过滤后生成的vcf 文件;
# p_1_2_3 生成结果的prefix
# 1_population.txt是一个文件包含同一个群体中所有个体,一般每行一个个体。个体名字要和vcf的名字对应。
# 2_population.txt 包含了群体二中所有个体。
#计算的窗口是500kb,而步长是50kb (根据你的需其可以作出调整)。我们也可以只计算每个点的Fst,去掉参数(--fst-window-size 500000 --fst-window-step 50000)即可。
代码参考:Fst的计算原理与实战
如果是按区间计算的,那么它以你定义的滑动窗口为单位,计算这个窗口内的平均Fst值
输出结果为:
data:image/s3,"s3://crabby-images/6d42f/6d42fbc507a976ca86e7cacde53227b4fad6b78c" alt=""
那么此时的Fst值(最后一列)代表一个窗口内的平均Fst值
参考:
http://wap.sciencenet.cn/blog-1094241-1104923.html?mobile=1
网友评论