一、基因家族与基因簇
在21世纪,几乎人人都知道达尔文的进化论,有质疑也有支持(现在已经不断发展出很多假说),其中支持派的一个重要的依据就是基因,基因组和基因组进化的发现。今天不讨论进化论的可信度,就说说基因家族以及基因组进化的知识。
通过某一祖先基因的重复和变异而传递下来的一组基因称为一个基因家族(gene family),成员们的外显子中具有相似序列,一个基因家族的基因可能成簇(cluster)排列或者分布在不同染色体中。
人类的20000-25000个基因可以归类到15000个基因家族,所以在人类基因组中,每个基因平均有约2个与它亲缘关系相近的基因。基因家族的基因成员也可进化成假基因(pseudogene),假基因序列与功能基因相关,但是不能被翻译成功能性肽链。
基因簇(gene cluster)可以是重复排列产生的两个相邻基因,或者数百个相同基因串联排列,这类大量串联重复可能是由于产物需求大,比如rRNA基因和组蛋白基因。
重复序列,尤其是位于同一邻近区域的重复序列,为由重组事件产生的进一步进化提供素材;同时也允许随机变异事件的发生,因为重组染色体可能改变了基因的拷贝数,而不仅仅是等位基因的重组。基因组中的高度重复组分还包括由很短的重复单元组成的串联拷贝,常分布在异染色质区域,比如卫星DNA(satellite DNA,重复单元5-50bp)和小卫星(minisatellite,重复单元10bp以内)。它们在显示个体基因组高度趋异的分析中有用,可以用于制作基因图或鉴定。
不等交换(unequal crossing-over)也成为非相互重组(nonreciprocal recombination)是指出现在相似或者一样的两个位点之间的重组事件,注意,这个位置不是精确同源的,而出现这个事件的可能是由于重复序列的存在。而不等交换事件可能是基因组成簇进化的机制(基因簇重排),它可能改变串联重复基因簇的大小,基因簇内的每一重复单元可被清除,也可扩展到整个基因簇。
二、基因组进化
随着测定的全基因组序列的物种数目越来越多,我们不仅研究比较一个基因组内单一基因之间的不同,也开始大规模的比较不同物种之间基因组的不同。
比如我们可以比较基因组之间的基因分布、重复与非重复DNA序列的比例、重复序列拷贝数等方面的差异。通过生物基因组对比的这些数据(原核-真核、动物-植物、脊椎动物-无脊椎动物)可以帮助我们理解基因组的进化。
研究发现原核与真核生物约有5000种基因是共同的,大部分参与基因功能;一些生物的基因组重复(多倍化)为随后的基因组进化提供了原始材料,这个过程诞生了许多开花植物的基因组,早期脊椎动物进化也可能是由于这个因素;在基因变异中非同义替换(影响了氨基酸序列)的趋异速率可以用于建立分子钟(molecular clock,分子钟假说认为氨基酸(蛋白质)或核苷酸(DNA)在所有的演化谱系中具有恒定的演化速率,所以将不同生物谱系按分子种构建树就可以估计不同谱系之间分化的时间,评估生物类群之间的进化关系和分歧时间)。
网友评论