-
一个群体在理想情况(不受特定的干扰因素影响,如非随机交配、选择、迁移、突变或群体大小有限),经过多个世代,基因频率与基因型频率会保持恒定并处于稳定的平衡状态。
-
实际上,总会存在一个或多个干扰因素。因此,哈代-温伯格定律在自然界中是不太可能的。基因的平衡是一种理想状态,并用于测量遗传改变的基准。
-
最简单的例子是位于单一位点的两个等位基因:显性等位基因记为A而隐性等位基因记为a,它们的频率分别记为p和q。频率(A) = p;频率(a) = q;p + q = 1。如果群体处于平衡状态,则我们可以得到
群体中纯合子AA的频率(AA) = p2
群体中纯合子aa的频率(aa) = q2
群体中杂合子Aa的频率(Aa) = 2pq
- 这些频率称为哈代-温伯格平衡。无限大小的群体经过一个世代的随机交配,基因型频率就能达到平衡。在没有其它因素的影响下,这种平衡状态将一直保持。
意义
- 其一个重要意义在于对抽样调查的结果进行检验,评估所研究的对象群体是否符合HW平衡,从而评估群体调查资料的可靠性,特别是在遗传流行病学关联研究中。
- 通常采用吻合度检验运用卡方统计量衡量基因型数目的观察值与该位点上全部基因型频率分布在符合HW平衡时的期望值之间的吻合程度。一般以P=0.05作为显著性水平的界值,
image.png image.pngP>0.05说明所调查的群体达到遗传平衡,即本次群体调查的数据可信;反之,P<0.05时,需要考虑以下问题:1.被调查的群体是否处于遗传平衡状态;2.遗传标记(如SNP)分型的技术或标准是否出现误差;3.是否达到随机抽样的要求。特别是后两点需要注意!
连锁不平衡
- 连锁不平衡又称等位基因关联(allelic association),其原理其实很简单。假定两个紧密连锁的位点1,2,各有两个等位基因(A,a; B,b),那么在同一条染色体上将有四种可能的组合方式:A-B,A-b,a-B,和a-b。假定等位基因A的频率为Pa,B的频率为Pb,那么如果不存在连锁不平衡(如组成单倍型的等位基因间相互独立,随机组合)单倍型A-B的频率就应为PaPb。而如果A与B是相关联的,单倍型A-B的频率则应为PaPb+δ,δ是表示两位点间LD程度的值。如果位点2上的等位基因B与疾病易患性有关,那么将会观察到等位基因A的频率在病人群体中高于对照群体。换句话说,等位基因A与该疾病性状相关。事实上,可以检测遍布基因组中的大量遗传标记位点,或者候选基因附近的遗传标记来寻找到因为与致病位点距离足够近而表现出与疾病相关的位点,这就是等位基因关联分析或连锁不平衡定位基因的基本思想。
- 产生和破坏连锁不平衡的因素
基因组中紧密连锁的基因位点在随机交配的群体中经过许多世代的重复交换而被随机化,出现了连锁平衡。概括地说,连锁不平衡可能有如下三个原因:1,被考察的群体来源于等位基因频率不同的群体,而且两个群体混合的时间不足以产生完全的随机化。2,两个基因位点之间的距离非常接近,以至于尚未经历足够的世代来被重组分开。3,某些连锁基因位点的等位基因的组合(单倍型)通过自然选择保持较高的频率。当由于以上原因群体开始偏离连锁平衡时,达到新的平衡所需的时间取决于基因位点间连锁的紧密程度:连锁越紧密,达到平衡的时间就越长。
网友评论