美文网首页生信相关分子进化
分子进化与系统发育

分子进化与系统发育

作者: 卧龙ac | 来源:发表于2017-09-26 00:23 被阅读105次

    作者:Masatoshi Nei, Sudhir Kumar
    简介:

    https://baike.baidu.com/item/%E5%88%86%E5%AD%90%E8%BF%9B%E5%8C%96%E4%B8%8E%E7%B3%BB%E7%BB%9F%E5%8F%91%E8%82%B2/10082116?fr=aladdin
    

    前言:
    统计学是一门用途极为广泛的学科,但有效的应用者却寥寥无几。对大多数人而言,传统的通往统计学知识之路被数学这堵令人望而生畏的高墙所阻挡。我们这里走的路就是避开这堵墙。
    Efron & Tibshirani(1993)

    分子水平进化方面有两门不同的学科:重建生物进化历史和研究进化的机制。近几十年来,这两门学科都取得了显著进展,主要是由于PCR和测序技术的飞速发展,使得大量DNA序列得以测定,大大加速了研究分子进化遗传学的研究速度。除此之外还有另一个原因就是数据分析的统计方法以及计算机技术的发展。

    本书的目的是:为分子进化研究提供有用的统计方法,并以实际数据为例,说明如何运用这些方法。

    第一章:进化的分子基础
    1.1 生命的进化树
    从达尔文开始,许多生物学家都想重建地球上所有生命的进化历史,并以系统树的形式描述这部历史。之前主要的研究途径有化石(零散且不完整)、形态学和生理学的比较(比较复杂,不能得出非常清晰的结论),随着分子生物学的进展,人们可以通过比较DNA来研究生物之间的进化关系。

    DNA蕴藏的的信息量巨大,同时DNA的进化演变或多或少是有规律的,因此能用数学模型来描述其变化,并且可以比较亲缘关系较远的生物间的DNA。

    形态性状的进化演变,即使在一段较短的进化时间,也是及其复杂的(体现在什么方面?)

    系统学或分类学是生命科学中争议最多的领域之一。一些分类单元的定义常常带有主观性。相对而言,系统发育学的争论少一点,因为它主要研究的是有机体之间的进化关系,而分类的工作相对没那么重要。

    分类应反映有机体的进化历史。

    1.2 进化机制
    进化的第一原因是基因突变(替代,indel,重组等)。然后通过遗传漂变或自然选择进行扩散,最终固定在物种中。

      当对某一类群构建了一颗有效的系统树,我们就可以找到具有此突变性状的谱系。
    
        通过将具有某特定形状的谱系所处的环境条件与无此性状的谱系所处的环境条件进行比较,就有可能会搞清楚该性状是由自然选择还是随机演化而决定的。
    
      现在一些遗传学家正在对一个基因座上的不同等位基因进行测序,来了解他们的进化历史。构建一个物种不同等位基因的系统树。
    

    1.3 基因的结构与功能
    从功能上看,基因分为两类:蛋白质编码基因和RNA编码基因。(补充基础知识而已,如蛋白质的编码方式等,密码子的简并性和偏好性)

    1.4 DNA序列的突变:
    转换、颠换、InDel、倒位、移码突变,提前终止突变等
    同义突变,非同义突变和无义突变
    短的插入缺失是由于DNA复制差错,长的插入和缺失要借助不等交换和转座。

    基因转换会改变一个DNA片段,使其与另一个片段完全相同,但是不改变基因的拷贝数。,这是由于异源DNA的错配修复引起的。

    1.5 密码子的使用频率:
    原因:1、tRNA丰度不同导致的(高表达)
    2、突变压。如不同基因组中GC含量不同,同时也影响了密码子的使用。突变压和净化选择共同影响了密码子的偏好性。

    Paste_Image.png

    不同的物种,碱基替换模式是不同的,主要体现在GC含量的不同,这给系统发育研究带来了困难。

    动植物中,GC含量变化范围很窄,特别是脊椎动物只在40~45% 之间浮动。基因组可根据GC含量的不同分为富GC区和贫GC区,有趣的是,在同质区,GC含量与第三个密码子的GC含量很接近。

    密码子用法偏倚的统计测度:
    使用密码子出现的绝对次数经常会出现不便之处,因为所检验的密码子总数不一定是相同的,因此密码子用法偏倚的更有用的测度是相对同义密码子使用频率(relative synonymous codon usage,RSCU),
    RSCU=Xi / X_ave
    Xi:编码该氨基酸低i个密码子的观测数
    X_ave:所有编码该氨基酸的密码子的平均使用次数

    第二章:氨基酸序列的进化演变

    1977年,DNA快速测序法发明(sanger 一代测序)之前,多数分子进化研究是基于氨基酸序列数据的,如分子钟理论的提出,。

    2.1 氨基酸差异和不同氨基酸的比例
    对于长度相同的序列,通过比较他们差异的氨基酸数目就可以度量序列间的分歧程度,但是当他们之间有插入或者缺失的时候没计算氨基酸差异数是没有意义的,需要将插入缺失的部分排除掉再计算。其实一般都是用比例值表示,称为p值距离。

    泊松矫正:
    p(差异碱基比例)与t(分化时间)呈现非线性关系的原因有重复突变和选择压力等。
    令r为一个特定位点每年的氨基酸替换率,并且假设所有位点的r都相同,t年后,每个位点氨基酸替代的平均数是rt。在一个给定点氨基酸替换数k(k=0,1,2,3,4,5,6...)的发生频率遵循泊松分布:
    P(k;t)=e^ -r t * ((rt)^k) /k!
    因此,在某一位点氨基酸不变的概率是p(0,t)=e ^ rt
    如果多肽链长度为n,不变氨基酸的期望值为ne ^(-rt)

    相关文章

      网友评论

        本文标题:分子进化与系统发育

        本文链接:https://www.haomeiwen.com/subject/tufjextx.html