美文网首页自然科普
【现学现卖】断裂的基因(Genes 第四章)

【现学现卖】断裂的基因(Genes 第四章)

作者: 番茄随笔 | 来源:发表于2020-05-15 03:31 被阅读0次

​4.1 引言

https://en.wikipedia.org/wiki/Intron  

在多数原核生物中,连续的3N个碱基编码一段含有N个氨基酸的蛋白质。而在一般真核生物中,基因比它所产生的功能转录物要长的多,主要由外显子(exon)内含子(intron)两部分组成,外显子序列包含在成熟RNA中,一个成熟的转录物(mature transcript)起始于一个外显子的5‘端,终止于另一个外显子的3’端,但是被内含子断开。

断裂基因的表达需要额外的步骤,首先要去除内含子,形成只含外显子的mRNA,这个过程叫做RNA剪接(RNA splicing)

https://en.wikipedia.org/wiki/RNA_splicing  

4.2 断裂基因由外显子和内含子组成

经过RNA剪接,外显子通常按照DNA中的相同排列顺序连接在一起,保持了基因和蛋白质具有的共线性关系。而一个基因的外显子位于一个RNA分子上,剪接时分子内反应,通常不存在不同RNA分子中的外显子连接。

直接影响蛋白质序列的突变位于外显子中,内含子的突变不会直接影响蛋白质的结构,但是可以影响mRNA产物的生成,比如抑制外显子的剪接,通常是有害的。内含子突变大多发生在内含子,外显子连接处单个碱基的置换,导致产物中外显子的丢失和内含子不切除,或是在异常位点发生剪接,通常的结果是产生一个终止密码子,从而导致肽链序列的截短。引起人类疾病的约15%的点突变是由剪接的破坏而引起的。

有些真核生物基因和原核类似,是没有断裂的,比如酿酒酵母大部分基因是非断裂基因,然而多细胞真核生物中,大部分是断裂基因,且内含子通常比外显子长很多。

4.3 外显子和内含子中的碱基组成是不同的

Erwin Chargaff研究DNA碱基组成,提出4条规则

(1)双链体DNA的第一均等规则(first parity rule):双链DNA,包括外显子和内含子。双链碱基A与互补链碱基T,G与C相匹配,%A =%T和%G =%C。

(2)第二均等规则(second parity rule):描述了单链DNA碱基组成的整体特征,%A = %T, %G = %C。这个规则提示,在单链DNA中,寡核苷酸有序地伴随着同样数量的对应互补寡核苷酸,即双链体DNA具有将折叠好的茎-环结构向外突出出去的潜能。茎部结构显示了碱基均等规则,环部结构显示碱基成簇现象。而且第二均等规则更多的适用于内含子,研究发现内含子中形成这样的二级结构的潜能比外显子高。

https://it.wikipedia.org/wiki/Stem-loop

(3)成簇规则(cluster rule):即DNA中,嘌呤和嘧啶往往分别聚集在一起,嘌呤A和G往往聚集在DNA双链体的一条链上(通常是非模板链),相对应的T和C往往聚集在其互补链模板上。

(4)GC规则(GC rule):即在基因组中,G+C的总体比例具有物种专一性。且外显子中GC含量往往高于内含子中。

4.4 断裂基因的结构是保守的

通过限制图,电镜技术,测序等可比较基因与其RNA产物,从而检测内含子

通过比较不同生物的同源基因,我们发现内含子的位置通常是保守的,但是内含子的长度变化可以很大,有时导致基因长度在25-31kb波动。

4.5 在负选择时外显子序列保守而内含子序列变化多端

在比较不同物种的相关基因时,我们发现相应的外显子序列通常是保守的,而内含子序列则很少保守。内含子在物种之间变化更大。

换个角度讲,外显子和内含子中发生突变的频率相同,但是外显子中突变可因不利而被除去,内含子由于缺少编码蛋白质功能所施加的压力从而自由积累碱基的变化。内含子不具有序列特异性的功能,但是,当基因处于正选择压力时,又会不一样。

4.6 在正选择时外显子序列变化多端而内含子序列保守

正选择(positive selection)即相对于没有突变的同类物种,某一物种上能给予更多优势表型的突变可能导致该物种更加有利的存活。

在这样的情况下,因为外显子比内含子选择进化的快,所以这时的模式开始逆转,不同于4.5。

4.7 基因大小的变化范围很广

外显子通常短小,典型的外显子编码小于100个氨基酸,一个基因的总长度主要由内含子决定

4.8 某些DNA序列编码多种肽链

多数DNA在经过剪接后,只编码一种肽链,但是也有编码多种肽链的情况。

比如重叠基因(overlapping gene),一个基因是另一个基因的一部分,编码出来的肽链也是完整肽链的一部分,就好像肽链产物发生了切割,产生了部分和完整长度的两种肽链。

还有另外的情况,就是不同的阅读框导致产生非同源的肽链。

https://en.wikipedia.org/wiki/Overlapping_gene

再有另外的情况,一些基因表达的可变模式导致外显子间连接途径的转换,使单个基因产生多种不同的mRNA产物,这些mRNA所含外面子不同,可产生不同蛋白质。可变剪接(alternative splicing)可使一段具有重叠序列的DNA翻译出多种肽链,表明细胞能合理使用空间。

https://en.wikipedia.org/wiki/Alternative_splicing

4.9 某些外显子与蛋白质功能域等同

我们都知道,蛋白质由独立的功能组件构成,如果将这些功能组件序列与基因序列对应,可发现基因断裂来自蛋白质结构域之间序列的选择性断裂而非随机性断裂。比如免疫球蛋白。

还有研究发现两个基因中的一些外显子具有相关性,支持了外显子使基因的功能性单元的观点。

4.10 基因家族成员具有共同的结构

多细胞真个生物中有许多基因与同一基因组内的其他基因相关,可能在不同等位基因或同一等位基因中。基因家族(gene family)定义为一组编码相关或一样肽链的基因。但是他们一般拥有一样的结构,比如珠蛋白基因就是一个基因家族的粒子,它可以分为两个亚家族,α和β,但是所有珠蛋白都具有三个外显子和两个内含子的共同组织形式。

而当基因相聚较远,却仍被认为有共同祖先时,这些基因组成的家族为超家族(superfamily),比如动物中的肌红蛋白和豆科植物的豆血红白蛋,和亚铁血红素结合蛋白有着共同起源。

所有蛋白质都来自于祖先基因的重复,变异和重组,因此祖先外显子的数目相对比较少。

相关文章

网友评论

    本文标题:【现学现卖】断裂的基因(Genes 第四章)

    本文链接:https://www.haomeiwen.com/subject/qxqqohtx.html