每周和你一起学习一些群体遗传的知识,每周和你一起进步,欢迎回来!上一回介绍完基本的群体遗传学的概念后,这周会给大家带来一些关于等位基因和基因型频率的相关知识。如果还没有看第一期的小伙伴,欢迎点击下面的连接,进行跳转阅读。
基础概念介绍
在学习群体遗传学时,我们会遇到很多陌生的概念。在深入理解对应的难点之前,最重要的一件事就是先把基础概念理解好掌握好。下面会列举一些和这次内容相关的重要概念,让大家快速的学习和理解。
基因座(locus/loci):基因组中特定的位点。基因座可以是可能是完整基因或单个核苷酸碱基对,如A-T。
等位基因(Alleles):在每个基因座中,通过突变产生的两种或更多种基因的替代形式,并且都存在于染色体上的相同位置中。等位基因可以进一步分为主要的等位基因(major alleles)和次要等位基因(minor alleles),这两个概念顾名思义就是根据等位基因出现的频率来定,还记得我们平时用来过滤SNP的MAF条件吗?其实MAF就是次要等位基因的出现频率。
单一同态性的(monomorphic):如果一个群体中的所有个体都有相同的等位基因,可以称这个基因座是具有单一同态性。
多态性(polymorphic):如果一个基因座中存在多个不同的等位基因,我们可以将这个基因座成为是具有多态性的。
同义替代(synonymous substitution):在编码蛋白质的基因的外显子中,一个碱基与另一个碱基的进化取代,使得产生的氨基酸序列不变。
非同义替代(non-synonymous substitution):是改变蛋白质的氨基酸序列的核苷酸突变。
单倍型(haplotype):在同一染色体上进行共同遗传的多个基因座上等位基因的组合;通俗的说法就是若干个决定同一性状的紧密连锁的基因构成的基因型。按照某一指定基因座上基因重组发生的数量,单倍型甚至可以指至少两个基因座或整个染色体。
看图学知识
为了进一步加深对上面概念的理解,我们可以通过下面的图例来对上述的概念进行进一步的理解:
简单介绍一下这幅图的信息:这个图展示了来自三个果蝇群体的个体中直系同源的ADH基因座信息。
其中,D. melanogaster (第一排a-l)and D. simulans (第二排a-f)是姐妹物种,D. yakuba(第三排a-l)是一个近邻的外群物种。这个表中的每一列都代表了来自每个个体的单倍型。这幅图只显示了具有不同等位基因的位点。在显示的位点中,如果该个体的等位基因和参考序列一致,就用横线表示。
位点834就是一个多样性的位点,有些D. simulans个体具有C碱基的等位基因,但是其它物种就就具有T的碱基。固定差异位点是在存在物种之间的,但在物种个体内是单态的。比如位点781,就是其中一个例子,只有D. melanogaster 的所有个体都具有等位基因碱基T,其它物种都和参考序列一样。当然我们还可以从不同的角度去看这些位点。比如就位点781来说,它也是一个非同义的突变位点。在位点1068中,等位基因T就是次要等位基因(该等位基因只占了少数)。
等位基因频率
等位基因频率是群体遗传分析的重要一部分,一般这个频率是通过基因型的计数来计算的。假设两个等位基因的二倍体常染色体基因座是分离的,分别为(A1 and A2)。N11和N12分别为A1A1纯合子和A1A2杂合子的数目。N为总的二倍体群体中的个体数目。那么咱们就可以推导出A1A1的等位基因频率(f11=N11/N
)和A1A2的等位基因频率(f12=N12/N
)。
使用上面提到的公式,等位基因A1在群体中的等位基因频率就等于:
知道了A1的等位基因频率之后,A2的等位基因频率就非常好办了(
q=1-p
)
今天的分享到这里就结束了,下一期会和大家继续学习和等位基因频率息息相关的核苷酸多样性 (π),分离位点还有哈迪温伯格定律,敬请关注!
网友评论