LncRNAs的识别
lncRNA被定义为长度超过200个核苷酸的非编码RNA分子,最初是由Okazaki等人在2002年对小鼠全长cDNA文库的大规模测序研究中重点描述的。
然而,很难区分lncRNA和蛋白质编码转录本。尽管蛋白质编码转录本通常以含有超过100个氨基酸的开放阅读框(open reading frame, ORF)的存在为特征,但一些lncRNA也可能含有如此长的ORF。
此外,一些转录本还可以在编码和非编码异构体之间进行转化。例如,SRA(甾体受体RNA活化剂)是一种特征良好的lncRNA,它也可以编码一种蛋白,拮抗其替代功能为lncRNA。
另一方面,编码肿瘤抑制因子的p53 mRNA也可以结合Mdm2 (Mouse double minute 2 homolog)蛋白,在RNA水平上直接发挥调节作用。到目前为止,lncRNAs识别的系统方法还没有完全建立,而一些公认的标准已经建立,如序列结构、大小、是否存在ORFs、密码子替代频率等。
LncRNAs的分类
作为一个广泛的概念,lncRNAs包含以下几种类型的RNA转录本。根据其在基因组中的位置,lncRNA可分为7大类:
- sense lncRNAs
- antisense lncRNAs
- bidirectional lncRNAs
- intronic lncRNAs
- intergenic lncRNAs
- enhancer lncRNAs。
a sense lncRNAs转录自同一链上的蛋白质编码基因,与蛋白质编码基因有重叠的外显子。
b antisense lncRNAs转录自反义链上蛋白质编码基因的重叠外显子。
c 双向lncRNA位于反义链,由邻近基因(小于1000个碱基对)近距离转录。
d 内含子lncRNA完全来源于蛋白质编码基因的内含子。
e 基因间lncRNA来自基因间区。
f 增强子lncRNA来源于蛋白质编码基因的增强子区域
从具体的功能来看,lncRNAs可以分为4类:(a) signal lncRNAs, (b) decoy lncRNAs, (c) guide lncRNAs and (d) scaffold lncRNAs。lncRNA存在于细胞核或细胞质组分中。
细胞质lncRNA可作为microRNA sponges或miRNA前体,发挥减少或增加microRNA的表达和功能。它们还可以识别目标mRNA,与细胞翻译机制相互作用。核lncRNAs可以通过顺式作用(调控邻近基因的表达)或反式作用(调控远处基因的表达)来影响染色质结构。此外,对于一些核lncRNA,其功能是顺式还是反式尚不清楚。
lncRNA的作用示意图LncRNAs的功能
lncRNAs可以调控基因表达,以多种作用影响许多重要的生理过程,如作为染色质修饰因子、X染色体失活因子、增强子、转录调节因子和转录后调节因子等。
1. 染色质修饰因子
LncRNAs已被证明以一种关键的方式参与染色质修饰,进而影响包括神经发生和干细胞多能性在内的多个重要生物学过程。
LncRNAs通过招募染色质重塑蛋白到特定的基因组位点来调控染色质状态。例如,Hox基因是一类与时间和空间发育轴相关的同源基因,其中数百个lncRNAs被证明是关键因素。其中的一个lncRNA,HOTAIR (Hox transcript antisense RNA)起源于HoxC位点,通过反式作用方式诱导PRC2 (Polycomb repression complex-2),沉默HoxD基因超过40kb,最终导致染色质抑制状态。
值得注意的是,PRC2是表观遗传沉默所需的组蛋白甲基转移酶,因此是重要的染色质修饰因子。除了HOTAIR之外,在体内仍有数千种RNA可以与PRC2结合。尽管这引发了在不同染色质背景下结合特异性和功能的问题,但这仍是一个lncRNAs与PRC2相互作用改变染色质状态的原型。
其他已被充分研究并已知可结合PRC2的lncRNAs包括Xist (X-inactive specific transcript)、Kcnq1ot1 (KCNQ1 overlapping transcript 1)、Braveheart、ANRASSF1等。例如Kcnq1ot1是一个印迹的重要中介lncRNA。Kcnq1ot1的启动子映射到Kcnq1基因的ICRs(印迹控制区),该基因编码一个负责心脏动作电位复极的电压门控钾通道蛋白。Kcnq1ot1与Dnmt1 (DNA(胞嘧啶-5)-甲基转移酶1)相互作用,建立Kcnq1区域内基因的胎盘特异性印迹。
Kcnq1ot1能够通过招募组蛋白甲基转移酶G9a和PRC2诱导组蛋白H3在赖氨酸9和赖氨酸27上的甲基化。在雌性哺乳动物的早期发育过程中,一条X染色体会发生失活,这种失活需要Xist。表达Xist的X染色体将被其包裹并包装成无转录活性的异染色质结构。
在此过程中,Xist将招募一系列蛋白,包括PRC2、SPEN、SAF-A (Scaffold Attachment Factor-A)和LBR,启动顺式作用的 X染色体失活。综上所述,核lncRNAs主要通过与染色质修饰蛋白相互作用来影响染色质状态。
2. 增强子
从活性增强子转录出一个lncRNA子集,反过来促进相应蛋白编码基因的表达,因此得名增强子lncRNA。2010年,Kim等人根据RNA聚合酶II定位于约3000个激活的增强子,在蛋白质编码基因外的增强子区域可以产生RNA的现象,从而提出了增强子RNA的概念。
几乎同时,Shiekhattar lab报道了具有增强功能的lncRNA。他们利用人类基因组的基因组编码注释功能对几种顺式作用的lncRNA进行了表征,并发现ncRNA-a1-7介导的一种RNA依赖性基因表达增强。
HSR1(热休克RNA-1,在人和啮齿动物细胞中组成性表达)与eEF1A协同工作,积极介导HSF1(热休克转录因子1)的激活过程。类固醇受体RNA激活物(SRA)也作为一种非编码转录本来协同激活类固醇受体。然而,到目前为止,增强子lncRNA的作用机制尚未明确。增强子lncRNA在各种生物学过程中的秘密有待进一步揭示。
3. 转录调节因子
真核基因的转录调控通过多种方式实现,包括传统的蛋白质与DNA调控元件的直接相互作用,以及最近发现的RNA、DNA和/或蛋白质之间的特定相互作用。因此,lncRNAs现在被认为是这种转录调控的一个重要方面。
对于顺式作用的lncRNA,其基因上的来源对其功能至关重要,因为它会改变附近蛋白编码基因的表达。它可能通过其本身的转录活性而不是转录本来发挥作用:如果另一个基因的启动子距离它较近,可能会导致两个基因上的转录机制发生碰撞,也称为“转录干扰(transcriptional interference)”。
例如,酵母中lncRNA SRG1的转录激活会抑制其下游SER3基因的转录,因为SRG1的3´末端与SER3启动子重叠。如果SRG1转录提前终止,SER3的抑制将得到缓解。同样是在酵母中,一些lncRNA的转录是通过改变染色质结构,从而促进蛋白质编码基因对RNA聚合酶的可及性,如促进FBP1(果糖-1,6-二磷酸酶1)基因的转录起始。
另一方面,lncRNA也可能起反式作用,通过与转录因子结合影响转录。例如,lncRNA 7SK与延伸因子P-TEFb结合并下调其激酶活性,以抑制Pol II的转录延伸。
4. 转录后调节因子
lncRNA主要通过剪接调控和翻译控制两种方式进行转录后调控。首先,lncRNA既可以与剪接因子竞争结合,也可以通过碱基配对与mRNA自身结合,阻断mRNA的剪接。
MALAT-1(肺腺癌转移相关转录因子)是一种丰富的~ 7kb的lncRNA,可与富含丝氨酸/精氨酸(SR)的剪接因子相互作用。这被认为是通过调节SR蛋白的磷酸化来调节它们在核斑点中的分布,从而影响pre-mRNA的选择性剪接。
MIAT(心肌梗死相关转录本)是另一个lncRNA(包含高度保守的串联重复序列UACUAAC),与SF1(剪接因子1)具有更高的亲和力,从而抑制剪接和剪接体复合物在其他转录本上的形成。
其次,lncRNA可以结合核糖体或翻译因子来控制蛋白质的翻译。例如,snaR(small NF90-associated RNAs)和Gadd7 (growth arrested DNA-damage inducible gene 7)是lncRNA结合核糖体控制翻译的两个例子。
另一方面,BC1 (Brain plasmic RNA 1)和BC200 (200nt Brain plasmic RNA)是lncRNA通过结合翻译因子eI4FA(真核翻译起始因子4A)、PABP (poly (A)-binding protein)等抑制翻译的例子。
最后,lncRNA也可以对microRNA sponges或microRNA前体作用来参与转录后调节。MicroRNAs是一类没有蛋白质编码能力的单链小RNA。MicroRNAs通过与目标mRNA的3´-UTR结合,可以抑制mRNA的翻译或促进mRNA的降解。在这种情况下,少数lncRNA可以通过影响相应的microRNA水平来改变mRNA水平。
LncRNAs的研究方法
一般情况下,对能够产生转录本的lncRNA进行量化和鉴定的实验程序都是相似的,虽然在下游实验过程中进行了一些修改。
在相同的生物样本中,LncRNA通常与mRNA一起使用测序或芯片技术(RNA-seq和-chip)进行量化。RNA序列分析在鉴定新的RNA转录本方面具有优势,在过去几十年得到了迅速发展。除了普遍应用的下一代测序(NGS),最近发展的RNA-seq包括单细胞测序、单分子测序和固定组织原位测序。
另一方面,转录组微阵列仍然在使用,并提供了同样丰富的数据与较低的随机变动性。特别是在临床研究中,当涉及到重现性和成本时,微阵列甚至比RNA-seq在基因表达的标准分析方面做得更好。
在lncRNA的功能分析方面,通过小干扰RNA或反义寡核苷酸来抑制靶向lncRNA,以及通过构建过表达来提高某些lncRNA的表达水平,是揭示其在体内作用的传统方法。近年来,革命性的CRISPR系统被用于通过CRISPR激活或CRISPR抑制(CRISPRa/i)来操纵转录本水平,或用于感兴趣的lncRNA基因座的基因组编辑。
对于核lncRNAs来说,用于研究lncRNAs和染色质关系的技术有:ChIRP(Chromatin Isolation by RNA Purification),CHART (capture hybridization analysis of RNA targets),RAP (RNA antisense purification),GRID-seq (capture in situ global RNA interactions with DNA by deep sequencing),他们广泛用于在全基因组识别lncRNAs的结合位点。
ChIRP、CHART和RAP只能研究已知的一个lncRNA,而GRID-seq提供了高特异性和敏感性的RNA-染色质相互作用的全局检测和分析。为了探索lncRNAs与蛋白质之间的相互作用,RIP (RNA immunoprecipitation),CLIP (UV crosslinking and immunoprecipitation),iCLIP (individual-nucleotide resolution CLIP)技术可以用来捕获lncRNAs结合蛋白。
类似的策略可以应用于细胞质lncRNAs,它们通常作为miRNA sponges或miRNA前体发挥作用。此外,随着lncRNA研究的积累,在过去几年中出现了一些数据库,它们对管理lncRNAs特别有用,比如NONCODE、ChipBase、lncRNAdb、LNCipedia和LncRNADisease。
在肾脏疾病中,lncRNAs研究的潜在临床应用与其他人类疾病相似,关注于生物标志物和治疗靶点,可能为肾脏疾病的诊断和治疗提供新的见解。
网友评论