在群体遗传学研究中,经常涉及到衡量种群和亚群遗传分化程度。因此各种统计量应运而生。这其中就包括F统计量(F-Statistics)。在各大研究性论文中都能见到:
Min Wang et al., Nature Genetics, 2018
Xuehui Huang et al., Nature Genetics, 2011
第三张Figure来自黄学辉研究员和韩斌院士的文章:“Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm”是GWAS应用于植物界的开山之作!
注意!F-Statistics是一系列统计值家族,而非单独的一个统计值。其与统计学中的F-test也没有关系。想要理解F统计量,我们先回顾一些群体进化的基础。
哈迪-温伯格定律(Hardy-Weinberg Principle)告诉我们在一个随机交配的无限大群体中,无论种群的初始基因频率如何,经过一代或几代随机交配 ,等位基因频率和基因型频率都会保持不变。
但是哈温群体是一种理想群体,现实中的群体在自然选择的推动下基因频率在代系间变化。加之地理隔离就会产生亚种群(subpopulations)。亚种群指的是受特定地理环境,生态环境以及生活习性等因素影响而相对独立的一个繁殖区里所有个体的总和,因此也被叫做地理种群。而当一个物种的群体遗传差异被加大时,在地理隔离的作用下,新的亚种群甚至物种就会产生。而推动群体遗传差异加大的因素就包括突变(mutation)和漂变(drift)。突变通过增加遗传变异来扩大亚种群间的遗传差异;漂变则依靠随机减少现有的遗传变异来扩大亚种群间的遗传差异。
1.Wright’s fixation index(Fst)
Wright’s fixation index也就是我们所谓的Fst,可以叫做近交系数或者分化系数。用于衡量亚群和种群之间分化的程度。Fst也是我们在群体遗传研究中最常用统计值,不含之一。在实际计算时经常从遗传多态性数据中估计,比如单核苷酸多态性(SNP)或微卫星标记。
Fst定义为在哈温平衡下,亚群杂合度的平均值(Hs)与总体等位基因频率计算的杂合度(HT)的差值除以HT。
即:Fst = (HT- HS)/HT
Fst取值范围为0-1,最大值为1,表明等位基因在各地方群体完全分化;最小值为0,意味着不同地方群体遗传结构完全一致,群体间没有分化。
Wright曾建议根据Fst大小划分遗传分化程度:
- Fst为0~0.05,群体间遗传分化很小;
- Fst为0.05~0.15,群体间中等程度的遗传分化;
- Fst为0.15~0.25,群体间高度遗传分化;
- Fst为0.25以上,群体间有极高程度遗传分化。
2.Reich’s F-statistics
Reich’s F-statistics是由Reich在2009年提出的。用于衡量系统发育中多个亚群的共同遗传漂变,应用于群体融合或者基因渗入的研究。其推论围绕着共有遗传漂变(shared genetic drift)展开,基于一个前提,即共同的遗传漂变暗示着共同的进化历史。
Reich‘s F群体发生以树的形式描绘。分枝长度代表着发生基因漂变的程度。因此一个分枝可以理解成由两个亚群组成,同时也代表着两个亚群共同的基因漂变。例如图A里:
- F2 ( P1 , P2)对应于从P1到P2的系统发育路径。
- F3 ( PX ; P1 , P2 )表示从PX到P1和P2内部顶点(第一个交汇点)的系统发育路径。因此,F3的第一个参数十分重要,其他两个参数可以任意切换。
- F4(B) ( P1, P2 ; P3, P4 )表示连接P1和P2的内部顶点到P3和P4的顶点的系统发育路径。
这里面F2,F3,F4就是三个Reich's F-statistics。分别代表着两个/三个/四个系的系统发育路径,也是几个路径的分枝长度(branch length)。同时还有另一种群体模型——混合群体(Reich’s F-statistics(B))。与Reich’s F-statistics(A)的不同在于扩展了群体融合的分枝,比如大量移民所导致群体融合。Reich考虑到F统计值的生物学意义,并没有构建更高维度的F(例如F5)。三个F统计值可以相互配合,以检验物种是否符合特定演化模型,例如岛屿模型。此外,Reich's F也可以用于检验基因渗入,未来或许会陆续出现在有关基因渗入与适应性的研究中。
参考信息:
1.王健康,《数量遗传学》 2017
2.Benjamin M Peter, Admixture, Population Structure,and F-Statistics, Genetics, Volume 202, Issue 4, 1 April 2016, Pages 1485–1501 https://doi.org/10.1534/genetics.115.183913
网友评论