这个得解释一下,由于本来想写一个APA(alternative polyadenylation, 选择性多聚腺苷酸化)的数据库的,对于这个方面的东西不是很懂。然后就查了一下,结果发现这个东西是位于3'UTR的一个调节方式,然后就想查查3'UTR的功能。结果就发现了这篇新出炉的文献。然后就有了下面的这个翻译(其实主要还是发现APA可以来发一些文章啥的,所以才折腾这么多,这个具体后面我们慢慢介绍)。
这个综述从3'UTR功能发现的角度来进行的讲解,其中最后讲到了关于3'UTR目前的实验方法。关于实验方法,只是翻译了第一部分,剩下的只是提供了标题,剩下的有感兴趣的可以去看原文。
另外,由于并不是专门研究3'UTR或者基础实验的,中间有的文字可能用的不是很准确,所以有可能会影响阅读。如果看不懂还是建议看原文😂。
原文链接(https://cshperspectives.cshlp.org/content/11/10/a034728)
今天的是综述的其中一部分,明天写第二部分。
第二部分可见:3'UTR的作用是什么?(二)
一分钟看完综述版本:
我们长期基于中间法则(DNA-RNA-Protein)的研究过程当中,人类基因组和更简单的真核生物的基因组中,蛋白质编码基因的数量是相似的。由于十分相似所以就不可能存在物种的差异性,为了寻找人类物种的复杂差异性,我们发现在mRNA成熟前的3'UTR区随着物种的进化其序列不断的延伸。另外由于选择性多聚腺苷酸化的产生也就导致了很多最终成熟mRNA序列相同但是前体的3'UTR不同的3'UTR异构体。而这些异构体有时候会发挥不同的功能。所以我们认为3’UTR可能在生物复杂性的调节中发挥重要作用。
目前对于3'UTR的功能的研究我们发现3'UTR主要有这些功能:
- 通过富AU元件(rich AU element)来调节mRNA的稳定性
- 3'UTR可以调控mRNA的定位表达
- 3'UTR可以调控mRNA的翻译
- 3'UTR结合多个RNA绑定蛋白来形式调控功能
- 3'UTR可以调控蛋白-蛋白相互作用
- 目前对于3'UTR研究的新方向: 使用CRIPR来进行研究;研究3'UTR特异性的翻译;研究3'UTR的异构体时间调节作用;确定3'UTR绑定蛋白之间的协同左右。其中第一个有翻译,剩下的三个没有翻译。想要了解的可以看原文。
1. 前言
基于中心法则,储存在DNA当中的遗传信息通过mRNA传递给蛋白。多年来人们一直以为从DNA到蛋白质的信息转移完全是通过将mRNA的编码区翻译成蛋白质的氨基酸来实现的。 虽然众所周知,mRNA的5‘和3’端也含有非翻译区(UTR),普遍的看法是,这些区域通过调节mRNA的翻译或稳定性在很大程度上调节了mRNA的定位或蛋白质的表达。
image在这种以蛋白质为中心的观点下,经过研究发现,人类基因组和更简单的真核生物的基因组中,蛋白质编码基因的数量是相似的。此外,不同物种的蛋白质大小基本相似。这表明蛋白质序列具有显著的保守性。在这种情况下,就出现了另外一个问题:什么使高等生物体具体更大的复杂性呢?在这种情况下,研究人员注意到3‘UTR所占据的序列长度在高等生物的进化过程中得到大大延伸,并且与生物的细胞复杂性相关。同时研究也发现,3'UTR区总是有几个到几百个核苷酸(NT)是高度保守的。进化过程中3‘UTR序列的扩展,再加上最近发现,储存在3’UTR中的遗传信息也可以通过3‘UTR介导的蛋白质-蛋白质相互作用(PPI)的形成传递给蛋白质,表明3’UTR可能在生物复杂性的调节中发挥重要作用。如果是这样的话,为什么3‘UTR不是每个人关注的中心呢?
对于3'UTR功能研究手段的缺乏限制其研究的重要因素。和转录或翻译调控或microRNA(MiRNA)介导的转录后调控研究相比,3‘UTR非依赖miRNA的研究远远落后。大多数的3'UTR主要是通过RNA绑定蛋白(RBP)来发挥作用的。但是相较于miRNA结合位点的研究,很多RBP的结合位点(motif)目前还不是很情况。即使有一些RBP的motif已经很明确了,但是这些motif经常间隔很远的距离,这样就不足语形成功能性的motifs。另外呢,很多RBPs具有相同的motif。这样我们就不是很清楚他们之间到底是竞争还是合作的关系了。最后,超过一半的人类基因使用交替的切割和多聚腺苷酸来产生仅在3‘UTR上不同的mRNA异构体。由于从不同的3’UTR异构体产生的蛋白质的氨基酸序列是相同的,这使得对3‘非编码区的异构体的研究具有挑战性。
2. 含有富AU元素的3‘UTR调节mRNA稳定性
核苷酸测序是在20世纪70年代发展起来的,它揭示了编码区和多聚腺苷酸信号之间存在未翻译的序列。掌握不同生物体基因的DNA序列可以让研究者进行第一次比较基因组分析。不同物种之间碱基的差异变化(碱基替换率)可以反映功能上的变化。早期的比较基因组分析发现非翻译区的碱基替换程度高于编码区,但它们也显示了3‘UTR中有一部分序列也存在高度的序列保守性。其中最有意思的发现是,研究人员发现在编码肌动蛋白蛋白的同源基因的3‘UTR序列在生物中高度保守,但当比较具有不同功能或组织分布的相似肌动蛋白异构体时,3’UTR序列高度差异。高度的保守性表明3‘UTR具有重要的调控作用,而3’UTR异构体序列的差异则表明3‘UTR含有额外的遗传信息来区分高度相似的蛋白质的功能。
通过对c-fos基因转化能力的研究首次发现3'UTR含有特异的c-fos功能元件。病毒内的fos(v-fos)基因可以在培养基当中转换为成纤维细胞;而细胞当中的fos(c-fos)基因就缺乏这种特性。有意思的是,这种功能上的差异不是由于这两个fos编码的蛋白的微小的差异造成的,而是由于其3'UTR的差异造成的。
当研究人员去掉3‘UTR时,c-fos也可以转化为成纤维细胞。这个发现激发了人们对于3‘UTR的研究,通过研究我们发现了富AU元件(rich-AU)。这种富AU元件可以导致mRNA的不稳定性(人们通过将富AU元件元件转移到一种稳定的、异源的mRNA,即β-actin mRNA上来进行研究得到的结果)。几乎同时,我们发现在一些富AU元件主要位于某一类的mRNA当中,这类的mRNA主要编码包括细胞因子;淋巴因子;生长因子和癌基因等在内的短期因子。同时呢,也发现富AU元件有时候相较于一些蛋白编码区域更加保守,这也 说明了在不同的物种当中富AU元件都是形式相同的功能。
3. 3'UTR调控mRNA的定位
在发现3'UTR的同时,研究人员也发现了3'UTR是mRNA亚细胞定位的重要调节因子。早期关于mRNA定位的研究,主要集中在卵或者卵母细胞当中,但是mRNA的定位不仅在发育早期至关重要,在其他的细胞(成纤维细胞,神经元等)都具有很重要的作用。然而,生殖细胞和发育的早期阶段对于RNA研究特别有利,因为早期动物发育中的基因调控取决于在胚胎转录开始之前母体从卵母细胞沉积的mRNA。例如果蝇的Bicoid基因就是在发育早期通过不同的定位来发挥不同的作用的。而Bicoid基因的不同定位主要是通过其3'UTR区的一段630nt的片段来进行定位发挥作用的。
4. 3'UTR调控mRNA的翻译
mRNA的不同的定位允许其蛋白质产物在不同的位置上发挥作用。在神经元当中,3'UTR可以调节树突和突触局部蛋白的合成。除了调控不同地方的蛋白产物,3'UTR还是空间性蛋白产物的调节因子。研究发现3‘UTR调控翻译的研究是在果蝇卵母细胞中Oskar mRNA和蛋白表达的差异上发现的。Oskar mRNA决定果蝇后极的体型。虽然Oskar mRNA在整个卵子发生过程中都存在,但只有在Oskar mRNA定位到后极后才能检测到Oskar蛋白。紫外光(UV)交联实验证实RNA绑定蛋白 Bruno是Oskar翻译调控的调控因子。Bruno与Oskar mRNA的结合阻止了Oskar蛋白的过早翻译,并且对于Oskar在正确发育阶段的表达是必要的,因为Oskar mRNA只有在到达卵母细胞的后极后才被翻译。
5. RNA绑定蛋白绑定3'UTR的顺式反应元件并介导多个和3'UTR相反的作用
最初,富AU元件被认为是mRNA衰变元素。然后,他们被证明也抑制翻译。之后,人们发现富AU的元素也可以增加蛋白质表达。例如,在静息的免疫细胞中,富AU的元素抑制翻译,但在脂多糖(LPS)刺激T细胞后,它们需要快速诱导蛋白质表达。这就导致了这样一个想法的产生,即:不是顺式元件本身导致了蛋白的表达,而是特殊的反式作用因子的结合决定了特定的3‘UTR的功能。
这一调节原理在小鼠体内缺失了62nt长的、富含AU的保守元件的TNF-α基因里得到了体现。完全缺乏富含顺式调节的AU元素的小鼠会导致炎症性关节炎和炎症性肠病,并在5至12周时使小鼠死亡。在未受刺激的条件下,富AU的元素会破坏mRNA的稳定。TNF-α的AU元件在非造血细胞中永久抑制翻译,在造血细胞中暂时抑制翻译。因为在被LPS激活后,它们最初会增加造血细胞中mRNA的稳定性和翻译,而在后期,它们会变得抑制。综上所述,富Au的元素是重要的调控元素,它能够快速和高度动态地调节蛋白质表达,并具有敏锐的开关。
现在有超过10种的RNA绑定蛋白可以结合到AU元件上。tristetraprolin (TTP)或者KHSRP通过招募降解mRNA的外泌体复合物而导致不稳定。Hur的结合稳定了含有富含AU的mRNA,所以可能是通过它是的3'UTR不能招募外泌体。这些发现说明了一个重要3'UTR的重要的功能即:RNA绑定蛋白绑定到3'UTR的顺式元件上,作为一个接头来招募效应蛋白。这些募集效应蛋白来产生观察到的效应。RNA绑定蛋白的接头作用很重要,因为效应蛋白不能和富AU区域进行结合。
imageRBP(红色,橙色)与mRNA的3'UTR(浅绿色)结合并募集各种效应蛋白。 外泌体(蓝色)的募集导致mRNA不稳定(左图),而运动蛋白(蓝色)的募集通过使用微管上的运动来调节mRNA的定位(灰色线;右图)。
3'UTR可以在不同的信号通路活跃的情况下产生不同的作用。这个可能是由于通路的活化改变了绑定同一位置的RNA绑定蛋白相对的表达量而引起的。RNA结合蛋白之间的竞争/合作最终将决定一个3'UTR的最终的功能。
相似的,单个RNA绑定蛋白可以在不同的发育阶段发挥不同的功能。在早期发育中,翻译主要通过Poly(A)尾长度进行调节,这是由CPEB(细胞质多聚腺苷酸元件[CPE]结合蛋白)决定的。CPEB与CPE结合可以调节mRNA的多聚腺苷酸、去烯化和翻译。CPEB通过绑定几个不同的因子来实现这些功能。CPEB可以同时和PARN和PAPD4结合。在卵母细胞中,含有CPE元件的mRNA具有短的Poly(A)尾巴导致的翻译抑制是由于在这些细胞中,PARN的活性高于PAPD4的活性,所以CPEB和PARN结合导致翻译抑制。卵母细胞受精后,CPEB被磷酸化,CPEB和PARN结合减少。这就导致了是聚(A)尾巴的加长,进而翻译启动。综上所述,在发育早期,蛋白质合成的时间调控通过3‘UTR发生,并由RNA绑定蛋白CPEB及其相关效应蛋白介导。因此,为了阐明不同的作用机制,需要对RBPs的相关效应蛋白进行鉴定和研究。
6. 超过一半的人类基因产生3‘UTR异构体
RNA聚合酶II对DNA的转录产生初级转录本,需要对其进行处理才能产生成熟的mRNAs。mRNA加工的步骤包括5'端加帽,内含子的剪接和3’端的切割/多聚腺苷酸。初级转录本在其3'端会延伸几千个核苷酸。随后一些切割和多聚腺苷酸化机制的因子与RNA聚合酶II一起移动,与功能性多腺苷酸信号的相遇导致内切。最后增加了聚(A)尾巴。因此,3‘端裂解和多聚腺苷酸化决定了3’UTR长度,由于长度的不同也就似的不同3'UTR异构体含有不同的顺式反应元件。
image在发现3‘UTR调控基因表达的几个方面大约10年后,一项文献调查显示,许多基因产生不同的3’端不同的mRNA异构体。当时,已知有95个基因产生替代的3‘UTR,而31个基因利用内含子多聚腺苷酸位点来改变蛋白质的羧基末端以及3’UTR。大约在同一时间,利用新的技术(expressed sequence tag, EST)发现相当大一部分人类和小鼠转录本使用选择性多聚腺苷酸信号来产生具有不同3‘UTR异构体的mRNA。深度测序技术的发展使得能够在全基因组范围内绘制mRNAs的所有3‘端图谱的方法得以建立。这些3‘端测序方法表明,超过一半的人和小鼠基因产生不同的mRNA亚型,它们的3’UTR不同,但编码的蛋白质具有相同的氨基酸序列。
7. 3'UTR异构体比率因细胞类型而异,并随信号通路的激活而变化
3‘-末端测序方法提供关于3’UTR长度的信息,并定量测量替代的3‘UTR亚型水平。对来自不同组织的样品的3‘端测序显示,功能性多聚腺苷酸位点的位置在不同的细胞类型之间没有变化,但3’UTR异构体亚型的表达率是具有高度的组织和细胞特异性。关于3’末端测序的数据现在可以看网上查看(3 ′-seq: http://cbio.mskcc.org/leslielab/ApA/atlas/ ; polyA_DB: http://exon.njms.rutgers.edu/polya_db/v3/ ; polyAsite: http://polyasite.unibas.ch/)
与存在于大量样品中的RNA-seq数据相比,3‘端测序数据的可用性仍然有限。因此,如果能够从RNA-seq数据中提取备选3‘UTR的表达将是非常有帮助的。由于3‘UTR上的RNA-seq读取覆盖高度可变,因此需要谨慎使用所获得的数据。如果使用严格的标准来鉴定3‘-UTR亚型表达的差异,那么RNA-seq只能发现由3’-端测序方法识别的少量变化(10%-15%)。另一方面,不太严格的分析包含许多假阳性结果。此外,改变的方向(缩短或延长3'UTR)只有15%的事件被认为是显著的。因此,目前,3‘端测序是确定替代3’UTR表达的首选方法。
除了特定于细胞类型外,替代性3'UTR亚型的表达还对受体刺激和随后的信号通路激活产生响应,如在免疫细胞刺激或突触激活过程中所示。3'UTR亚型比例的变化可以通过使细胞暴露于细胞外刺激而实现,并且可以通过添加生长因子,细胞因子或神经递质通过实验模拟。最近发现,在小鼠卵母细胞从生发泡期到中期II的成熟过程的9个小时的过程当中中,3‘UTR长度发生了巨大的变化。对于20%的基因,3‘UTR异构体表达的改变导致了其miRNA和RNA结合蛋白的结合位点的变化,进而导致了蛋白表达发生变化。
网友评论