长链非编码RNA通过编码翻译蛋白质多肽发挥其生物学功能;核糖体与 lncRNAs 结合,一方面可能使 lncRNA 编码翻译,另一方面可能调控蛋白翻译。来自广州医科大学附属第三医院晏光荣教授团队在 Advanced Science(IF 15.84)上发表“Small Protein Hidden in lncRNA LOC90024 Promotes “Cancerous” RNA Splicing and Tumorigenesis”,证实 lncRNAs 具备编码潜能,探讨其编码的小蛋白质多肽在肿瘤中的作用机制。
研究背景
转录因子(TF)在信号转导通路中起调控下游靶基因的作用,影响肿瘤等疾病的发生发展;癌细胞中编码 TF 的基因通常会被扩增,缺失,重排或突变。许多致癌信号通路选择 TF 的功能以改变基因表达,从而驱动肿瘤发生和发展。人类基因组大概有28, 000个 lncRNAs(长链非编码RNA),在表观、转录和转录后水平各司其职,调控基因的表达,尤其在肿瘤等疾病中更是作为 biomarker 影响了肿瘤/疾病生物学特征的各个方面,成为医学研究的中流砥柱。目前发现有极少 lncRNA 通过编码翻译蛋白质多肽发挥其生物学功能。哪些 lncRNAs 具备编码潜能以及这些隐藏在 lncRNAs 中的蛋白质小肽在肿瘤中扮演什么角色?是一个值得探索的科学问题。
研究思路
1. LncRNA LOC90024编码合成一个小蛋白质
利用翻译组高通量测序,发现 lncRNA LOC90024 可以结合核糖体。这表明 LOC90024 可以被翻译成蛋白质或者小肽,亦或是以 lncRNA 分子的形式参与调控翻译过程。通过生信分析预测到,lncRNA LOC90024 有一个393个核苷酸的开放阅读框(ORF),可编码合成约130个氨基酸长度的蛋白质,命名为SRSP。为证实 SRSP 的存在,作者将 ORF 的 ATG 突变为ATT,又利用 GFP 或 Flag 等标签标记蛋白产物、质谱检测 SRSP-GFP 融合蛋白,证实lncRNA LOC90024 确实可以合成蛋白质 SRSP。
通过SRSP抗体和质谱两种检测手段,作者发现 SRSP 广泛存在于人类肿瘤细胞和肿瘤组织中,是一种内源表达蛋白。
图1 A. lncRNA LOC90024中存在一个小开放阅读框,可编码130 aa的小蛋白;D F western blot、质谱技术技术检测SRSP蛋白的存在2. SRSP 而非 LncRNA LOC90024 本身促进结直肠癌的发生发展和侵袭转移
当敲除或者敲低 LOC90024,均可抑制结直肠癌的发生,但这其中到底是 lncRNA LOC90024 还是 SRSP 在起作用呢?由此,作者分别构建了三个不同的表达质粒:LOC90024 ORF-Flag、5’UTR-ORF-Flag(5’U) 和 5’UTR-ORFmut-Flag(MUT)(表达LOC90024却不编码SRSP),分别用于恢复LOC90024敲除细胞的基因表达。结果发现前两者可恢复LOC90024敲除造成的影响,而 5’UTR-ORFmut-Flag 却不能。将前两个质粒分别导入结直肠癌细胞,可促进癌细胞的增殖和迁移,但 5’UTR-ORFmut-Flag 却不能。再结合转录组分析,发现 SRSP 过表达可改变癌细胞中2816个基因的表达水平,而不具编码功能的 lncRNA LOC90024 过表达,只改变了43个基因的表达水平。
综上可知,SRSP 而非 lncRNA LOC90024 本身可促进肿瘤发生发展和迁移。
3. SRSP 与剪切因子 SRSF3 互作,通过调节 Sp4 的可变剪切调控肿瘤发生发展
蛋白互作分析发现SRSP互作蛋白多富集在RNA结合蛋白中,显著富集的种类包含 RNA 剪切,其中剪切调控因子SRSF3,因为参与 premRNA 的可变剪切且参与多种人体肿瘤的发生发展过程中,吸引了作者的注意,作为进一步研究的对象。
转录组分析发现,SRSP 过表达促进3792个可变剪切事件的发生,由此推测 SRSP 通过与 SRSF3 在内的剪切因子互作,调控mRNA可变剪切事件的发生。肿瘤发生发展离不开转录因子的调控,其中 Sp4 转录组因子因 SRSP 过表达,促进外显子3包含转录本的产生(L-Sp4),抑制跳跃外显子3转录本的产生(S-Sp4),但不影响Sp4转录水平。由此调节 Sp4 转录本的长度。外显子3中包含 SRSF3 结合 motif 位点 CAACCA,通过位点突变验证发现与 Sp4 外显子3直接结合的是 SRSF3 而非 SRSP。当过表达 SRSP 时,显著增强了 SRSF3 N 末端与 Sp4 的 E3区域的结合,而 SRSP 也是与 SRSF3 的 N 末端结合,由此推测,SRSP 增强了 SRSF3 对 Sp4 外显子3的识别与结合力。
通过 LOC90024 编码区及非编码区突变,以及 LOC90024 ORF-Flag、5’UTR-ORF-Flag(5’U) 和 5’UTR-ORFmut-Flag(MUT) 质粒恢复突变实验,证实 SRSP 的产生直接影响 L-Sp4 和 S-Sp4 转录本的比例:相对正常组织,肿瘤的发生未显著改变 Sp4 转录水平,但其中 L-Sp4 转录组本比例增高,且与 SRSP 水平成正比,S-Sp4 转录本则成反比。L-Sp4 编码合成784氨基酸,而 S-Sp4 编码合成49氨基酸。在敲除 Sp4 的结直肠癌细胞中分别表达 L-Sp4 和 S-Sp4,发现只有 L-Sp4 表达可恢复细胞的致癌性。
综上可知,L-Sp4 而非 S-Sp4 刺激结直肠癌的发生发展。
结论
本研究通过核糖体结合RNA测序发现 lncRNA LOC90024上存在一个编码130aa小蛋白的开放阅读框ORF,编码一个在组织细胞中内源性表达和天然存在 SRSP 小蛋白。功能分析发现是SRSP能够促进结肠癌的发生发展和侵袭转移而不是 LOC90024 lncRNA 本身。SRSP 促进转录因子 Sp4 外显子3(发现有SRSF3结合位点CAACCA)的inclusion,进而增加长Sp4剪接体的形成,抑制无外显子3的短 Sp4 形成(S-Sp4)。在肿瘤细胞中L-Sp4转录本具有促癌功能,能调控一系列癌基因的表达,而S-Sp4转录本缺乏转录激活区,不能调控基因的表达。
本篇文章比较全面的打开了 ncRNA 可编码小肽的检测和功能验证思路。
参考文献:
Meng N, Chen M, Chen D, Yan GR, et al. Small Protein Hidden in lncRNA LOC90024 promotes “cancerous” RNA splicing and Tumorigenesis[J]. Advanced Science, 2020, 7, 1903233.
网友评论