肿瘤CNV调控性ceRNA网络构建

作者: 概普生信 | 来源:发表于2020-02-05 09:18 被阅读0次

    今天给大家分享的是去年10月末发表在Frontiers in Genetics(IF: 3.517)上的一篇文献,该文献主要讲的是识别恶性胶质瘤中受拷贝数变异驱动的异常调控性ceRNA。

    Identification of Dysregulated Competitive Endogenous RNA Networks Driven by Copy Number Variations in Malignant Gliomas

    恶性胶质瘤中受拷贝数变异驱动的异常调控的竞争性内源性RNA网络的识别

    摘要:

    胶质瘤占恶性脑瘤的80%。由于异质性高,胶质瘤的致瘤机制尚不清楚。在本研究中,作者开发了一种新的方法来识别低级别胶质瘤(LGG)和多形性胶质瘤(GBM)中受拷贝数变异(CNV)驱动的竞争性内源性RNA (ceRNA)相互作用。通过分析来自癌症基因组图谱(TCGA)的基因组和转录组数据,本文首先发现了受CNV显著影响的蛋白质编码基因和长链非编码rna (lncRNAs),并通过定制的流程进一步确定CNV驱动的异常调控的 ceRNA相互作用。最终LGG中得到了13776对cnv驱动的异常调控的ceRNA对(包括3954个mrna和306个lncrna),GBM中262对(包括221个mrna和11个lncrna)。本文的结果表明,大多数的ceRNA相互作用在LGG和GBM中被CNV削弱,许多CNV驱动的基因在异常调控的ceRNA网络中共享相同的ceRNA。功能分析表明,CNV驱动的ceRNA网络参与了细胞周期、p53信号通路、TGF-beta信号通路等肿瘤发生的重要机制。进一步研究表明异常调控的ceRNA网络中的ceRNA对揭示了与恶性胶质瘤的肿瘤发生相关的更详细的生物学功能。此外,通过探索CNV驱动的ceRNA与预后和组织学亚型的关系,作者发现MTAP、KLHL9和ELAVL2的拷贝数状态与LGG的总体生存相关,并与组织学亚型高度相关。总之,本研究为胶质瘤的分子机制和临床生物标志物的研究提供了新的思路。

    方法:

    1.数据:

    从TCGA数据库(https://tcga-data.nci.nih.gov/tcga)下载LGG和GBM的DNA拷贝数(SNP 6.0)、mRNA和miRNA表达数据,从TANRIC下载lncRNA表达数据。作者提取了样本匹配的拷贝数变异数据和基因表达数据,包括435个LGG和152个GBM样本。对于DNA拷贝数数据,作者使用GISTIC2.0确定了LGG和GBM中基因的离散拷贝数的五个类型(-2,-1,0,1,2),并排除了10%以上样本中没有CNV的基因。基因表达值用log2(tpm+1)归一化,表达平均值低于30%或缺失值超过10%的基因被剔除。

    2.CNV驱动的蛋白质编码基因和lncRNA的识别

    为了降低噪声的影响,作者使用GISTIC2.0保留了高水平的扩增和缺失,并对存在2和-2状态的基因使用二项式检验,样本量较小的拷贝数的状态被认为是噪音,拷贝数的状态被设置为0 (P < 0.05)或删除(P >=0.05)。然后,对于每个蛋白质编码基因或lncRNA,作者将基因表达数据按拷贝数状态进行分割,并对两组进行秩和检验。拷贝数状态和基因表达一致变化的基因被认为是CNV驱动基因(P < 0.05)。

     

    3.异常调控的受CNV驱动的ceRNA-ceRNA网络的识别

    作者开发了一种计算方法来识别异常调控的受CNV驱动的ceRNA-ceRNA相互作用,它包括以下步骤:(1)在每个拷贝数状态下获得ceRNA–ceRNA相互作用。mRNA-miRNA和lncRNA-miRNA的相互作用是从StarBase v2.0获得的。使用每种拷贝数状态(即扩增,缺失和正常)中的mRNA,lncRNA和miRNA的表达谱,作者计算了ceRNA对之间的皮尔逊相关系数(PCC)以及mRNA / lncRNA(ceRNA)和miRNA以进行测量它们的表达相关性。ceRNA对之前具有显著正相关性(调整后的p值<0.05),每个miRNA-ceRNA相互作用显示出显著负相关(调整的p值<0.05)被视为该状态下的候选ceRNA三元组。(2)计算拷贝数状态之间ceRNA调控的差异。作者假设由CNV引起的异常调控将影响每个候选ceRNA三元组中ceRNA相互作用之间的相关性。因此,作者将扩增/缺失样本中的ceRNA与正常样本的相关性进行了比较,以确定失调的程度。失调的程度定义为:

    其中cor v(ceRNA1,ceRNA2)是从扩增/缺失样品估计的PCC,而cor n(ceRNA1,ceRNA2)是从正常样品估计的。如果候选ceRNA三联体仅以一个拷贝数状态存在,则也使用之前过滤的相关性来计算ΔR。

    (3)识别CNV驱动的ceRNA-ceRNA相互作用失调。为了确定ΔR是否在统计学上显着,进行了随机(permutation)检验。作者将拷贝数状态的标签随机化1000次,并重新计算每个ceRNA对的相关系数的变化。满足P值为0.05的互作对认为是CNV驱动的失调的ceRNA-ceRNA相互作用。R脚本在GitHub上可用(https://github.com/EmeraldG1996/orangejuice/tree/master/ceRNA-interaction)。

    4.功能富集分析

    为了进行功能富集分析,首先获得了LGG / GBM的基因表达谱,并从TCGA获得了匹配的正常样品,并筛选了差异表达基因。基于倍数变化值,作者进行了基因集富集分析(GSEA),以发现分别在LGG和GBM中改变的基因的KEGG通路和GO功能。然后,使用超几何检验进一步确定ceRNA网络(参与了哪些与癌症相关的功能:

    其中N是基因表达谱中的基因数量,n是参与ceRNA网络的给定基因数量,M是参与癌症相关KEGG通路/ GO功能的基因数量。

    5.临床数据统计分析

    从cBioPortal (http://www.cbioportal.org/)中下载432 LGG and 124 GBM患者的临床数据。通过Kaplan-Meier估计构建总体生存曲线,并使用对数秩检验(P <0.05)来确定与生存相关的显着拷贝数变化。Cox比例风险回归模型用于研究基因表达与OS之间的关系。进行Fisher精确检验,以检测与拷贝数变异的临床病理相关性。

    结果

    1.识别LGG和GBM中的DNA拷贝数变异

    为了系统地评估LGG和GBM中的拷贝数变异(CNV),作者对TCGA SNP 6.0阵列数据执行了GISTIC2,以获取每个基因的拷贝数状态。在LGG中检测到85个假定的CNV,在GBM中检测到65个。作者将识别出的CNV分为两种类型,即扩增或缺失,以进行进一步分析。在大多数GBM患者中可见原癌基因的局部扩增。例如,在23例患者中发现了PDGFRA的扩增,分别有71例和28例患者显示了EGFR和CDK4的扩增。作者还发现一些患者具有肿瘤抑制基因的局灶性缺失,例如CDKN2A和CDKN2B。LGG上癌基因的扩增不如GBM广泛,但在LGG中也发现了CDKN2A / B的局部缺失,这被认为是神经胶质瘤中的负性细胞周期调节剂。

    2.不同的拷贝数状态影响蛋白质编码基因和lncRNA的表达

    为了识别受CNV影响的蛋白质编码基因和lncRNA,作者结合了LGG和GBM中的拷贝数数据和表达谱。基于秩和检验,作者确定了其拷贝数变化(在不同拷贝数状态之间)与其表达变化一致的基因(P value < 0.05)。在LGG中,52个蛋白质编码基因和2个lncRNA的表达分别受CNV严重影响,包括46个蛋白编码基因和1个lncRNA显示扩增,以及6个mRNA和1个与缺失相关的lncRNA。在GBM中,有47个蛋白质编码基因和lncRNA与拷贝数状态显著相关,包括与扩增相关的36个蛋白质编码基因,9个与缺失相关的蛋白质编码基因和2个lncRNA。虽然研究的CNV驱动基因在扩增/缺失拷贝数状态与正常状态之间被识别,但在以前的研究中仅确认了几个基因,例如GBM中的ELAVL2。这些基因的基因组定位表明,显著影响LGG和GBM中表达的CNV可以分为三种和五种模式(下图所示)。在GBM中,CNV集中在10q23.31,9p21.2-21.3,4q12,12q13.3-14.1和7p11.2中,与以前的报告一致。在这些区域中,大多数患者中观察到某些基因的CNV,包括已被证实对GBM的发生和发展很重要的许多基因,例如EGFR,CDKN2A / CDKN2B和MTAP。据报道9p21.3的缺失与GBM的发生有关。对于LGG,CNV集中在9p21.2-21.3,4q12,12q13.3-14.1。已经提出这些区域中的几个基因对于预后很重要。例如,CDKN2A是弥漫性低级神经胶质瘤生存不良的预测指标。

    在LGG和GBM中,被识别为拷贝数缺失(扩增)的基因的表达水平通常会降低(增加),这与之前报道一致。同时,作者发现一个基因组区域内不同基因的表达变化程度不同。例如,在GBM中,当拷贝数更改时,位于9p21.3区域的DMRTA1和LINC01239的表达相差10倍。

    3.识别异常调控的受CNV驱动的ceRNA网络

    鉴于现有ceRNA研究中缺乏对调节因子的探索,作者设计了一个程序来识别由CNV驱动的异常调控的ceRNA相互作用。该程序可以大致分为三个步骤。首先,分别基于LGG和GBM中mRNA / lncRNA-miRNA的相互作用获得候选ceRNA三联体。为了获得由CNV驱动的ceRNA对,作者计算了每个拷贝数状态(扩增/正常或缺失/正常)中ceRNA对的相关性变化。如果CNV增加相关性,则CNV可增强ceRNA对。相反,ceRNA对被CNV削弱。最后,作者使用扰动来获得由CNV驱动的重要ceRNA对。通过以上三个步骤,最终在LGG中获得了13776个CNV驱动的ceRNA失调对,包括3954个mRNA和306个lncRNA。在GBM中,获得了262个拷贝数驱动的失调ceRNA对,包括221个mRNA和11个lncRNA(Table2)。

    接下来,为了深入了解由CNV引起的ceRNA相互作用失调,作者使用Cytoscape 3.7.0可视化了ceRNA网络(下图2C)。通过观察GBM的ceRNA网络,作者发现大多数ceRNA相互作用是由于CNV驱动的ceRNA而被削弱,只有少数CNV驱动的ceRNA(ELAVL2和PDGFRA)显示出相反的影响。在LGG中也得到了相似的结果。有趣的是,许多CNV驱动的基因在ceRNA网络中共享相同的ceRNA,LGG中共享的ceRNA的数量大于GBM。例如,已被证明在神经胶质瘤中很重要的VOPP1和CDKN2A,是由GBM中的KCTD5链接。CNV驱动的ceRNA MARCH9也受到ELAVL2的调控,并且它们共享最多的ceRNA(例如MTMR1,STMN1和CECR2)。CNV削弱了STMN1和ELAVL2 / MARCH9之间的相互作用,而MTMR1和CECR2的相互作用被MARCH9扩增减弱,而ELAVL2缺失则增强了相互作用。在LGG中,MTAP和CDKN2A共享的ceRNA包含许多与神经胶质瘤和其他癌症高度相关的基因,例如IDH1和CDK4 / 6。一些研究表明,CDKN2A和MTAP的共同缺失可以用作神经胶质瘤分层的标志物,而CDKN2A的缺失与CDK4 / 6在各种肿瘤中的表达有关。

    4. 异常调控的受CNV驱动的ceRNA的功能特征

    为了评估异常调控的CNV驱动的ceRNA的作用,作者使用功能分析分析它们在LGG和GBM中的异常功能。在LGG中,最重要的KEGG通路(例如细胞周期和p53信号通路)已显示在肿瘤发生中起关键作用(图3A)。在GBM中,失调的ceRNA主要富集于与细胞周期有关的类别,例如细胞周期G1 / S相变和细胞分裂,有丝分裂姐妹染色单体分离,有丝分裂细胞周期相变的负调控和有丝分裂纺锤体组织(图3B)。

    作者用相同的方法进一步研究了每个CNV驱动的ceRNA对的功能。通过与所有失调的ceRNA的功能进行比较,作者在LGG和GBM中获得了更详细的肿瘤相关功能。在LGG中,确定了三个KEGG通路和四个生物学过程(图3C),包括调控癌症发展的通路,例如MAPK信号传导,已证明可显著促进神经胶质瘤细胞的增殖和迁移。此外,作者观察到了富含细胞周期的ceRNA对,包括CDKN2A(CNV驱动的ceRNA),CDK4和CDK6。已经证明细胞周期是由CDKN2A介导的,其拷贝数缺失驱动的失调可以抑制CDK4和CDK6,从而阻止了从G1到S期的转变。作者还发现GBM中许多癌症相关的生物学功能,例如p53信号通路,DNA复制以及与细胞周期相关的GO功能(图3D)。这些结果表明,通过注释失调的ceRNA,可以发现与神经胶质瘤相关的更精确的调控机制。

    5. 探索CNV驱动ceRNA网络中的community结构

    基于生物学网络的特殊拓扑结构可能影响ceRNA的功能特征的假说,本文分析了CNV驱动的ceRNA网络的重要community结构对肿瘤生成影响的功能(下图A(GBM),B(LGG))。

    LGG的最大community包含了798个节点,包括一些胶质瘤相关基因如IDH1,CDK4/6,大多数ceRNA对是受拷贝数缺失驱动的。功能富集分析显示6个GO功能和5个KEGG通路显著富集在community中(p<0.05),如mesenchyme development,p53 signaling pathway 和 TGF-beta signaling。在这个community中,BMP-7,作为受MTAP驱动的ceRNA,已被证明是一种肿瘤抑制因子,通过抑制上皮间质转化(EMT)来抑制干样胶质母细胞瘤细胞的增殖,自我更新和肿瘤萌发。在所有富集功能中,cell cycle是最显著的(Figure4B),CDKN2B引起了作者的注意。作为CNV驱动的ceRNA,据报道CDKN2B在恶性神经胶质瘤的肿瘤发生中起功能性作用。其ceRNA对CDK2和RBL1在细胞周期中也有注释,并位于该途径的下游(图4C)。从GBM community也获得了类似的结果。已确定具有34个基因的GBM的最大community与细胞周期相关的生物学过程(有丝分裂细胞周期的G1 / S过渡)和癌症相关的途径(DNA复制)有关(图4D)。

    6. 与预后和组织学表型相关的CNV驱动的ceRNA

    为了检验CNV驱动的ceRNA对预后的影响,本文评估了拷贝数状态差异的CNV驱动的ceRNA对临床结果的影响。本文在LGG中识别了一些显著与OS相关的ceRNA(log-rank test p-value<0.05,Figure5),但在GBM中没有显著的结果。对于LGG,结果显示出MTAP,CDKN2A,CDKN2B的的缺失有差的预后。受CDKN2B缺失驱动的异常调控的ceRNA网络富集在Epac1/Rap1通路上,它证实与胶质瘤细胞死亡相关。通过使用COX风险比例模型,本文发现了CNV驱动的ceRNA,如MTAP,KLHL9和ELAVL2等,它们的缺失导致了差的预后,也代表了表达和生存时间的显著差异(Table3,单因素生存分析,P<0.05)。它们中的七个,例如,KLHL9显示出独立的预后因子(Table3,多因素生存分析,P<0.05)。

    另外,作者发现CNV驱动的预后因子也显示出与组织学亚型高度相关(Table4,Fisher精确检验,p<0.05)。有趣的是,所有亚型相关的CNV驱动ceRNA都位于9p21缺失区域。9p21的缺失,特别是CDKN2A/B和MTAP的共缺失,可能是不同分级胶质瘤的标记。有趣的是,CDKN2B,CDKN2A,MTAP和KLHL9也属于异常调控ceRNA网络中,暗示出它可能抑制胶质瘤的发展。除此之外,发现lncRNA,RP11-321l2.2,它的ceRNA互作对涉及了MAPK和PI3K通路。

     好了今天的分享就到这里了,这篇文献思路清晰,比较新颖还是很值得借鉴的。

    相关文章

      网友评论

        本文标题:肿瘤CNV调控性ceRNA网络构建

        本文链接:https://www.haomeiwen.com/subject/jrmjxhtx.html