美文网首页
基础知识1:人类遗传变异

基础知识1:人类遗传变异

作者: 小程的学习笔记 | 来源:发表于2023-07-27 11:19 被阅读0次

    ❀ 遗传变异的起源

    人类基因组的一份拷贝含有大约30亿个核苷酸,分布在23对染色体上。遗传变异则是群体内个体之间 DNA 序列的差异。遗传变异可以发生在生殖细胞(germ cells)中,也可以发生在体细胞中(somatic cells),但只有发生在生殖细胞中的变异可以遗传给子代。突变重组是变异的主要来源。

    genetic variation-1
    1) 体细胞突变(Somatic Mutations)

    ꔷ 体细胞,是指身体的二倍体细胞,包括除单倍体配子(生殖细胞)之外的身体所有细胞。例如皮肤细胞、肌肉细胞、神经细胞、骨细胞等。

    ꔷ 体细胞突变是指发生在生物体生命周期中配子受精之后的体细胞内的DNA变化

    ꔷ 体细胞突变可以在细胞分裂过程中遗传给突变细胞的所有后代,但它们不能遗传给后代(仅来自突变细胞的组织受到影响)。它可能发生在受精卵的发育过程中;因此,孩子出生时可能会出现体细胞突变。它可以是由于 DNA 复制过程中的错误而自然发生(自发)的,也可以是由于诱变剂而诱导的。

    ꔷ 体细胞突变最常见的例子是人生命中癌细胞的出现。在研究方法上主要偏重采集癌症组织和正常组织进行比较得到结果,从研究意义上来讲,Somatic更偏重于单个患者的癌症分型和发病机理的研究。

    2) 种系突变(Germline Mutations)

    ꔷ 生殖细胞是发育成配子并融合在一起形成二倍体体细胞的单倍体细胞。它们仅在性腺中发现和产生,负责有性生殖。例如生殖母细胞、雄配子(精子)和雌配子(卵子)。

    ꔷ 种系突变是指发生生殖细胞(配子)内的DNA变化

    ꔷ 种系突变是可遗传的,因此它被传递给下一代(整个生物体中的每个细胞都会受到影响)。它发生在配子形成期间的减数分裂期间,负责遗传疾病、变异和物种进化。它也可以是自发的或诱导的类型。大多数情况下,是自发性的。

    ꔷ 在研究方法上,Germline 的 mutations 在家系分析中占有重要角色,对很多遗传病(包括亨廷顿病、血友病、18-三体症、唐氏综合症等)的研究中占有重要地位。在测序过程中,除了个体测序之外,还会加上个体的家属一同测序。病理分析时也会考虑家族背景的影响。

    1. 突变

    突变是遗传变异的来源之一,是DNA 序列的永久性改变。 当DNA复制过程中出现错误且未被DNA修复酶纠正时,就会发生从头突变(de novo mutation)。只有当错误通过DNA复制被复制并固定在DNA中时,才被认为是突变。突变可能对生物体有益;对生物体有害(有害);或中性(对生物体的健康没有影响)

    1.1 单碱基对替换(single base-pair substitution)

    genetic variation-2

    1)\color{orange}{单核苷酸多态性(single nucleotide polymorphisms,SNPs)}

    ꔷ 主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是针对"群体"而言的,在群体中应占有一定的比例(>1%)。此外,通常所说的SNP是指ꔷ 由单个碱基的转换或颠换所引起。比如,C转换成T,C颠换为A

    ꔷ 转换的发生率约占SNP的2/3。在哺乳动物基因组上C->T的转换比较多,这是因为基因组上的胞嘧啶C在甲基化的修饰下容易发生C->T的转变。人类遗传基因的各种差异,90%可归因于SNP引起的基因变异。在人类基因组中,每隔100至300个碱基就会存在一处SNP位点。每3个SNP位点中有2个会是胞嘧啶(C)和胸腺嘧啶(T)的相互转变。

    ꔷ 这种变异大多是发生在生殖细胞上的,属于胚系/种系变异,是可遗传的。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,人类30亿碱基中共有300万以上的SNPs,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关

    ꔷ SNP是研究人类家族和动植物品系遗传变异的重要依据,因此被广泛用于群体遗传学研究(如生物的起源、进化及迁移等方面)和疾病相关基因的研究,在药物基因组学、诊断学和生物医学研究中起重要作用。目前,已有一些SNP位点被证明与人类健康息息相关,如β-地中海贫血、苯丙酮尿症、镰状细胞贫血等。

    2)\color{orange}{单核苷酸位点变异(single nucleotide variant,SNV)}
    ꔷ 没有频率限制,可用于描述任意一个可以被测序检测到的碱基突变。既可以是胚系/种系变异,也可以是体细胞变异。例如在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation)

    ꔷ 随着过去十几年的测序技术的发展,人们现在有能力对单个个体进行高通量测序,越来越多的SNV可被检测到。在精准医疗领域,SNV可作为蛋白质功能丧失和疾病风险的实用标志物,还可以确定对靶向疗法有响应的患者,并用来预测一些人类疾病的治疗效果和预后信息,尤其是癌症。

    3)补充说明

    ꔷ 不论是SNP或是SNV都有以下两种形式:
    \ \ \ 转换(transition):嘧啶(胞嘧啶/胸腺嘧啶)与嘧啶,或嘌呤(腺嘌呤/鸟嘌呤)与嘌呤之间的替换
    \ \ \ 颠换(transversions):嘧啶与嘌呤之间的替换

    ꔷ 转换和颠换如果发生在基因的蛋白质编码区内,根据点突变对基因转录和蛋白质翻译产生的影响定性,可以把点突变分同义突变(synonymous mutation)非同义突变(non-synonymous mutation) 两种。
    \ \ \ 同义突变 = 中性突变 (neutral mutation) = 沉默突变 (silent mutation)
    \ \ \ \color{orange}{同义突变(synonymous)}的原因是点突变发生在密码子的第三个核苷酸,由于遗传密码的简并性,这个突变后的密码子恰恰同突变前的密码子编码同一氨基酸,故不改变翻译出来的氨基酸类型。

    \ \ \ 非同义突变 = 错义突变 (missense mutation) + 无义突变 (nonsense mutation)
    \ \ \ \color{orange}{错义突变(missense)}是指受到影响的密码子变成另一种新密码子,编码一个新的氨基酸,使氨基酸序列发生变化。错义突变大多发生在密码子的第一位或第二位核苷酸。
    \ \ \ \color{orange}{无义突变(nonsense)}是指一个编码氨基酸的密码子,在点突变后变成了一个终止密码子,使多肽合成提前中止,肽链长度变短而成为无活性的截短蛋白。

    ꔷ 不在蛋白质编码区的 SNP/SNV 仍可能影响基因剪接、转录因子结合、信使RNA降解或非编码区的RNA序列。

    ꔷ TCGA数据库中包含这两种数据,但是SNP数据是不开放的,要通过申请获得,而SNV数据(通过全外显子测序分析得到(WXS,whole exome sequencing ))就是开放的,有VCF文件和注释后的MAF文件(https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline/)

    1.2 插入或缺失(insertion- deletion,Indel)

    genetic variation-3

    指在原核苷酸序列中插入或丢失1个或多个相邻核苷酸,长度范围从一个到数百个碱基对不等。当Indel发生在基因间区或内含子区时,对基因表型没有影响;当发生在编码区(coding regions)时,又分为以下两种方式 :

    1)\color{orange}{移码突变(frameshifting)}
    ꔷ 由非3的倍数个核苷酸的插入或删除造成。因基因表达时密码子是由三个核苷酸组成,此类插入或删除会使处在突变发生位置下游的密码子阅读框架发生移动,进而使mRNA在此突变以后翻译出完全不同的蛋白质。

    ꔷ 移码突变在开放阅读框越上游的区域发生,对蛋白质的影响越大,且因移码突变可能使终止密码子被抹掉或引入新的终止密码子,也会改变翻译出蛋白质的大小,一般会使其完全失去功能。

    ꔷ 核苷酸插入引起的移码突变,可能通过缺失恢复到野生型的DNA序列;但如果是由于缺失而引起的移码突变,则一般是不可能恢复到突变之前了。

    2)\color{orange}{整码突变(inframe)}
    ꔷ 整码突变是指可被3整除的核苷酸的插入或缺失,mRNA的读取框不会被破坏。

    1.3 结构变异(structural variation)

    主要是指大段的DNA序列发生变异的情况,涉及至少 50 个核苷酸和多达数千个核苷酸

    genetic variation-4

    1)\color{orange}{缺失(deletion)}

    2)\color{orange}{插入(insertion)}

    3)重复(duplication)
    \color{orange}{散在重复序列(interspersed duplication)}:指分散地分布在整个基因组中的重复序列,主要起源于转座子和逆转座子
    \color{orange}{串联重复序列(tandem duplication)}:指由重复单元(长度为 1-500bp)经多次重复而形成的序列

    4)\color{orange}{倒位(inversion)}:同一条染色体上发生了两次断裂,产生的片断颠倒180度后重新连接

    5)易位(translocation):染色体的一部分转移到同一条染色体的其他部位或其他染色体上
    \color{orange}{平衡易位(balanced translocation)}:指两条染色体各发生一处断裂并相互交换位置,形成两条新的杂合染色体,也称为相互易位。平衡易位仅仅引起染色体片段位置的改变,仍然保留了全部的基因数量(遗传物质的总量并没有增减),绝大多数平衡易位都不会对携带者造成健康方面的影响(由易位导致的致病性基因融合除外)
    \color{orange}{不平衡易位(unbalanced translocation)}:与平衡易位类似,也是两条染色体之间发生了片段的位置交换,但是在位置交换却发生了基因丢失(遗传物质的增减),导致携带者出现明显症状。

    6)\color{orange}{拷贝数变异(copy number variation)}:一般指长度1KB以上的基因组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复

    7)\color{orange}{染色体重排(chromosomal rearrangement)}:指基因从所在的染色体的正常位上易位至染色体的另一个位置上,这种位置改变基因处于激活状态,产生异常基因产物或移动到另一条染色体上

    2. 重组

    重组是遗传变异的另一个主要来源,指两个不同姐妹染色体间遗传物质的交换。我们每个人都有来自父母的遗传物质的混合物,当同源DNA链对齐和交叉时,这种遗传物质的混合发生在重组过程中。重组导致后代产生不同于任一亲本的新性状。真核生物减数分裂期间的DNA重组产生新的遗传信息,并可以从父母传给后代。大多数DNA重组是天然存在的。

    genetic variation-5

    1)\color{orange}{同源重组(Homologous recombination)}
    ꔷ 发生于减数第一次分裂前期(四分体时期),同源染色体非姐妹染色单体交叉互换,导致染色单体上的基因重组,增加了遗传多样性

    ꔷ 同源重组通常不会影响染色体的数量和基因组的大小,但会导致某些基因型的变异和基因重组,同源重组对于物种的进化和遗传多样性的维持具有重要作用

    ꔷ 同源重组存在于所有生命形式中的 DNA 代谢过程,可提响应复杂 DNA 损伤而进行修复,包括 DNA 缺口、DNA 双链断裂 (DSB) 和 DNA 链交联 (ICL)等 DNA 损伤。

    2)\color{orange}{非同源重组(Nonhomologous recombination)}
    ꔷ 减数第一次分裂后期,非同源染色体自由组合,导致非同源染色体上非等位基因自由组合(产生不同基因组合的配子)。这可能导致染色体易位,有时会导致癌症

    ꔷ 非同源重组通常会导致染色体的数量和基因组的大小发生变化,例如染色体数目的增加或减少,或者基因组的重组组合发生改变.非同源重组在物种进化中也起着重要的作用

    3. 总结

    变异类型/对比 基因突变 基因重组
    条件 外界环境条件的变化和内部因素的相互作用|有性生殖过程中进行减数分裂形成生殖细胞
    发生时间及原因 有丝分裂间期或减数第一次分裂前的间期

    由于外界理化因素引起的碱基对的替换、增添或缺失
    减数第一次分裂前期和减数第一次分裂后期

    四分体时期非姐妹染色单体的交叉互换;随着同源染色体的分开,位于非同源染色体上的非等位基因进行了自由组合
    变异的结果 基因的分子结构发生改变,产生了新基因(等位基因),也可以产生新基因型,出现了新的性状 不同基因的重新组合,不产生新基因,而是产生新的基因型,使不同性状重新组合
    发生率 频率低,但普遍存在 在有性生殖中非常普遍
    意义 变异的根本来源,是生物进化的原材料 变异的来源之一,是形成生物多样性的重要原因

    相关文章

      网友评论

          本文标题:基础知识1:人类遗传变异

          本文链接:https://www.haomeiwen.com/subject/hviqpdtx.html