美文网首页
2. 基因的谱系

2. 基因的谱系

作者: 芜穀杂粱 | 来源:发表于2020-01-08 00:50 被阅读0次

    2. 基因的谱系

    “不要一千八,不要九九八,你和你全家,测序带回家!”现代测序技术很便宜了,有了你和家人的测序结果,你可以知道你的某个基因的两个拷贝哪个来自你爸,哪个来自你妈。如果测序再久远一点,“问候”到你祖上十八代,你可以追溯你的每个基因的家族史。现在假设我们“问候”全部现存人类的祖先,那么我们就可以得到惊人的结论:对于每一个人类基因组上的位点,我们都可以找到历史上某个时刻的一个基因拷贝是现存所有当前位点基因的共同祖先。

    更进一步解释这个问题,我们来康康另外一个计算机模拟实验(图5)。我们这次跟踪一个位点上的10个基因拷贝的家系,该实验种群有5个个体 [每个个体在该位点有两个等位基因,所以总共10个基因拷贝] 。这些基因拷贝可以是一样的序列,也可以是不一样的,这无关紧要 [我们这次只关注一个“位置”内某个基因拷贝的演化史]。同样,我们还是要保证这个模拟过程没有选择发生,即所有的个体有相同的存活和繁殖的机会。在模拟实验的第一代,一些基因拷贝丢了:有可能是因为个体随机去世了,也有可能是亲本在减数分裂中整没了。看看图5-B,这时只有原先第0代的6个基因拷贝在后续的第1代中保留了。单是因为命不好,第0代的4个拷贝就领便当了,再也不能和其他小伙伴一起继续骚了。等到第1代搞出了第2代,存活和繁殖中的随机事件又灭掉一个拷贝(图5-C)。 [在不考虑突变引入新的变种/回复旧的类型的情况下,] 一个基因拷贝的世系一旦断流,就无法再续前缘,因此基因世系的数量只会减少。

    等到第7代,所有后代的基因拷贝都会是原始拷贝中唯一一个家伙的子孙(图5-D)。从第7代回看这个历史,我们所有现存基因都可以追溯到一个基因拷贝。图中红线标注的家谱,就叫基因树(gene tree)

    图5:基因树的演化。这个例子中没有选择发生,不同拷贝在后代数量上的差异全是漂变的结果。A. 种群最开始由5个二倍体个体启示,所以总共有10个基因拷贝。不同的颜色形状只是为了区分不同的拷贝,并不表示DNA序列不同或相同。D. 到了第7代,所有的基因拷贝都是起始种群中的一份基因拷贝的后代。这些基因的基因树由红色线标示。代表汇合(Coalescence)事件的基因拷贝用黑框标出,第7代中所有现存基因拷贝的最近共同祖先是第0代中标黑框的那个。

    这个图中要注意,凡是没有留下后代的基因拷贝都看作是“灭绝”了,它们在历史上可能存在,但是在回顾式的追溯中,是没有办法断定的(如果没有化石证据),因此不能算作完整基因树的一部分。这里我们用绿色标示的是基因延续的路径,而过去时间点上灭绝的基因不用红色标注在基因树中。

    2020年1月7日00:16:22


    如果我们再跑一次模拟程序,结果会怎么样?要知道遗传漂变是随机的,因此其他的足够幸运的遗传拷贝将有可能成为未来所有后代的祖先。进一步的,一个基因拷贝成为全部现存拷贝的祖先所需要的代数也可能不同。[因为是完全随机的过程,所以谁成为祖先和演化代数都是不确定的。]

    现在再说说谱系:祖先基因演化的路线。倒放这个过程,当两个基因拷贝合并时,我们说他们“聚合(coalesce)”了。在图5中这种事件由基因树上的分枝点(节点node)呈现,这代表着后续基因拷贝的最近共同祖先(most recent common ancestor)。如我们所见,如果追溯的时间足够久,我们可以找到一个物种的一个位点上所有现存基因的最近共同祖先 [注释1]。如果种群很小,那么追溯到全部基因最近共祖的时间会相对近,如果种群很大,则要追溯到遥远的过去。

    注释1:如果我们研究的基因位点发生基因重组,这个追溯的过程会变得复杂一些。任何一个位点上的基因都会有我们讨论的这种基因树。但是基因重组的存在会使该位点的不同部分有不同的基因树。[这是因为,交换重组时,如果我们原先选定作为研究对象的位点没有作为一个整体完整地交换,而是被拆分成了几段,一些交换到四分体中另一个同源染色体上,一些保留在原先的位置,那么这个研究对象拆开的每个部分会随着不同的姐妹染色单体进入不同的配子,而经历不同的漂变过程,产生不同的基因树。因此,存在交换时,一个位点会有多个基因树。] 不过,我们这里的讨论中忽略重组引起的复杂变化,因为核心的规律是不变的:具体来说,就是对于任意一个位点,总是存在一个现存所有生物携带的拷贝的最近共同祖先。

    【问题记录-3:自己尝试画一下交叉重组下的基因树吗?】

    图5还揭露了另外一个关键点:尽管现在所有现存基因都只是历史上一个祖先拷贝的后代,但是这不意味着在历史上只存在唯一一个拷贝(或一个个体)。这个例子中,最近共祖所在的那一代还有其他9个基因拷贝,只不过它们意外地没有留下子嗣,然后消失在了演化的长河中。

    [基因谱系的一个重要的人类学上的应用是“线粒体夏娃”与“Y染色体亚当”的发现。] 如果我们可以追溯所有现存人类线粒体基因的基因树,我们最终会找到唯一一个线粒体基因组是所有人类的祖先。因为线粒体基因是母系遗传的,这个携带者所有人类线粒体基因的共同祖先的人一定是个女性。现存人类线粒体基因组多样性的分析表明这个女人应该生活在距今125000年前。有时我们称她为“线粒体夏娃”。但这个名字具有误导性,因为当时还有很多其他的女性也存在并且为现存人类的其他基因做出了贡献,[而不是只有一个“夏娃”]。同样的,如果我们追溯所有Y染色体回去,会找到一个男性。[因为Y染色体是父系遗传。]

    可以确定,线粒体基因的祖先是女性,Y染色体基因的祖先是男的。显然,不同的基因有不同的基因谱系。而追溯回去的共同祖先也相应的并不一定生活在一起。[也就是说,由于基因片段不同,它们的谱系不同,追溯回去的代数、时间、历程都不同。显然的,线粒体夏娃和Y染色体亚当不大可能生活在一起。因此这两个称呼具有强烈的误导性。] 这是一个适用于所有有性生殖物种基因组的普遍规律:基因组上的每一个部分都有不同的谱系。

    跨越物种的基因谱系也是存在的。如果我们同时追溯所有现存人类和所有黑猩猩(chimpanzee)的线粒体基因,携带有我们线粒体基因的共同祖先单拷贝的家伙是人类和黑猩猩的共同祖先 [这句话不太好理解,换个说法是,所有黑猩猩和人类的线粒体基因是一个单一拷贝的后代,而这个单一拷贝的携带者是人类和黑猩猩的共同祖先。这是显然的道理啦],它生活在大概距今8百万年(地质年代单位:Mya)前,那时人类和黑猩猩两个演化支还没有分开。追溯地再久远些,所有真核生物线粒体基因都是从二十亿年前的一个共同祖先那儿遗传来的。这个线粒体留下了辉煌的遗产:这段DNA现在遍布于地球上所有动物植物真菌和真核藻类的体内。

    2020年1月8日00:51:54

    【问题记录-4:在考虑突变的情况下,基因树会变成什么样?一个已有的位点突变后,这个基因谱系是怎么表示的?没有影响吗?基因树是一个只有“相对关系”没有“实际体现”的概念吗?

    科学家怎么通过现有的“静止的”片段多态性来重构历史上的基因树呢?】

    相关文章

      网友评论

          本文标题:2. 基因的谱系

          本文链接:https://www.haomeiwen.com/subject/kcwlactx.html