Fst的含义、计算与应用

作者: 爱吃海椒的妹妹 | 来源:发表于2022-05-13 17:41 被阅读0次

    一、Fst含义

    群体间遗传分化指数(Fst):是种群分化和遗传距离的一种衡量方法,分化指数越大,差异越大。Fst居于0~1之间,越接近1表示两个群体之间分化程度越大,受选择程度越高,反之亦然。

    二、Fst计算

    #对每一个SNP变异位点进行计算(按单点计算)
    vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2—single
    #按照区域来计算 
    vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2_bin --fst-window-size 500000 --fst-window-step 50000 
    

    test.vcf是SNP calling 过滤后生成的vcf 文件;
    p_1_2_3 生成结果的prefix
    1_population.txt是一个文件包含同一个群体中所有个体,一般每行一个个体。个体名字要和vcf的名字对应。2_population.txt 包含了群体二中所有个体。
    --fst-window-size # 设置计算Fst的窗口大小,根据自己的数据进行设置,看看别人文章里怎么用的
    --fst-window-step # 设置计算Fst的步长长度,根据自己的数据进行设置
    我们也可以只计算每个点的Fst,去掉参数(–fst-window-size 500000 --fst-window-step 50000)即可。

    image.png
    群体中的Fst值-学习篇 - 百度文库 (baidu.com)

    三、Fst值的范围

    实际研究中,Fst为0~0.05:群体间遗传分化很小,可以不考虑;
    Fst为0.05~0.15,群体间存在中等程度的遗传分化;
    Fst为0.15~0.25,群体间遗传分化较大;
    Fst为0.25以上,群体间有很大的遗传分化

    四、 计算完了之后该干啥?

    1、按窗口式计算Fst值的处理

    在对两个群体之间进行不同区段的Fst计算之后,需要判断哪一些区段,是“真正”受到了选择压力,根据近期看的文章,得到可以选择前5%的作Fst为一个阈值,对区域进行划分,高于该阈值的被认为受到了选择压力的影响,进一步就可以得到是受到影响的是哪些SNP,最终即可得到受到影响的是哪些gene。

    「陈有朴」原文链接:https://blog.csdn.net/qq524730309/article/details/123489362

    2、当然,对Fst的计算结果可视化,当然也是非常重要的一部分,

    fst图的一些可视化图

    image.png
    引自群体遗传进化必备小知识 (qq.com) image.png
    Fst的计算原理与实战_hs6605015的博客-CSDN博客_fst计算

    相关文章

      网友评论

        本文标题:Fst的含义、计算与应用

        本文链接:https://www.haomeiwen.com/subject/nshuurtx.html