引言:今天跟大家分享的是2020年十一月份发表的一篇针对肺腺癌缺氧和干细胞指数构建lncRNA相关ceRNA调控网络的文章。
Construction and investigation of a combined hypoxia and stemness index lncRNA-associated ceRNA regulatory network in lung adenocarcinoma
肺腺癌缺氧和干细胞指数lncRNA相关ceRNA调控网络的构建与研究
生信分析,数据挖掘,更多意向分析 可填写意向分析表
更多生信文章,https://biosxr.gaptools.cn/#/ https://biosxr.gaptools.cn/#/
研究主要探讨与肺腺癌(LUAD)缺氧和干细胞相关的ncRNA分类。高缺氧和高干细胞指数的LUAD患者比低缺氧和低干细胞指数的患者预后差。分析这两个簇的RNA表达谱,筛选出差异表达(DE)的mRNAs。功能分析表明DE mRNAs与细胞周期和DNA复制有关。蛋白质-蛋白质互作网络分析显示20个hub基因,其中CENPF、BUB1、BUB1B、KIF23和TTK可能是调控缺氧诱导肿瘤细胞干细胞化的关键基因。CeRNA网络分析表明AC079160.1-miR-539-5p-CENPF轴可能参与了LUAD缺氧诱导肿瘤细胞干细胞化的调控。
方法
数据
从TCGA和GEO(GSE31210)数据库下载LUAD患者的RNA测序数据和相应临床数据。用无监督的二维层次聚类对LUAD样本进行聚类,用欧氏距离评价样本间的相似度。Kaplan-Meier曲线和log-rank检验用于分析不同聚类间的预后差异。
筛选差异表达(DE)mRNA、lncRNA和miRNA
配对t检验筛选簇3和簇4的DE mRNA、lncRNA或miRNA,对多个试验进行多重P值校正。
DE-mRNAs的功能表征
DE-mRNAs的生物学功能通过GO和KEGG通路进行表征。利用Cytoscape构建蛋白质-蛋白质互作(PPI)网络。根据最大团中心度(MCC)评分对DE基因进行排序,确定前20位为hub基因。
预后分析
分别从TCGA和Kaplan Meier-plotter 数据库下载了mRNA表达数据和临床信息,用Kaplan-Meier生存图评估LUAD患者的总生存率(OS)。Kaplan-Meier曲线和log-rank检验预测DE lncRNA和DE miRNA对预后的影响。计算95%置信区间(CI)的总风险比(HRs)评估差异表达的lncRNA或miRNA对LUAD患者的预后作用。为了探讨DE基因拷贝数对预后的影响,用cBioPortal (https://www.cbioportal.org/)分析基因突变频率。
ceRNA网络的构建及相关分析
用Hub基因、DE-lncRNAs和DE-miRNAs构建ceRNA网络。StarBase (https://starbase.sysu.edu.cn/)用于建立ceRNA网络。用Cytoscape对网络进行可视化,同时对节点表达与缺氧和干细胞指数的相关性进行了分析。
结果
缺氧和干细胞化对LUAD患者生存的影响
根据TCGA中肺癌患者的缺氧和干细胞指数,聚类分为5个簇(图1a)。然后比较了不同簇间无病生存率(DFS)的差异(图1b)。簇3和簇4的DFS差异显著(图1c),而其他簇之间的DFS差异不显著(图1b)。使用GSE31210验证了缺氧和肿瘤细胞干细胞状态分类器的组合模型,患者分为a、b、c 3组(图1d),分析了簇的DFS(图1e)。考虑到c组样本数量太少,比较了a组和b组的预后,b组的预后比a组更令人满意(图1f)。
图1 LUAD患者的聚类分析和预后分析(图片来源PMID:33148251)分析上皮间质转化(EMT)调控基因在不同簇中的表达,结果表明,SNAI1和ZEB1在簇4中的表达水平显著高于簇3(图2a,b)。然而,簇3和簇4之间的CDH1表达没有显著差异(图2c)。
图2 EMT调控基因SNAI1的表达分析(图片来源PMID:33148251)干细胞化和缺氧对mRNA表达的调控作用
在基因组水平上缺氧和干细胞化明显影响了mRNAs的表达(图3a)。C1QTNF7、ADH1B、GRIA1、GGTLC1和CD207是前5位上调的mRNAs(图3b)。PBK、TPX2、NEIL3、MYBL2和FAM64A是前5个下调的mRNAs(图3b)。通过对DE mRNAs的GO分析,发现差异mRNAs主要参与DNA复制、核分裂和染色体分离(图3c)。KEGG分析显示DE mRNAs富集的代谢通路与DNA复制和有丝分裂有关(图3d)。利用PPI网络分析DE mRNAs之间的关系,根据MCC评分确定PPI网络的Hub基因,如图3e所示。
图3簇3和簇4间差异mRNAs的识别和功能分析(图片来源PMID:33148251)hub基因表达对LUAD患者生存的影响
在TCGA数据库中,CENFP、BUB1、BUB1B、KIF23和TTK高表达的患者预后较差,表明这些基因的表达有利于LUAD的进展(图4)。
图4 CENFP预后分析(图片来源PMID:33148251)然而,其他hub基因的表达对LUAD患者预后无明显影响。在Kaplan
Meier-plotter 数据库中,20个hub基因的预后分析结果与TCGA数据库的结果一致(图5)。
图5 CENFP预后分析(图片来源PMID:33148251)干细胞化和缺氧对lncRNA和miRNA表达的调控
在簇3和簇4筛选了DE lncRNA基因,其中564个lncRNAs上调,243个lncRNAs下调(图6a)。根据FC进行排名,前5个上调的lncRNAs和前5个下调的lncRNAs如图6b所示。图6c显示了风险评分能够独立预测患者总体生存率的DE lncRNAs。
图6簇3和簇4间差异lncRNAs的识别和预后分析(图片来源PMID:33148251)与簇4相比,还确定了簇3中77个上调的miRNAs和166个下调的miRNAs(图7a)。前5位上调的miRNA分别是has-miR-133a-3p、has-miR-1-3p、has-miR-34b-3p、has-miR-1247-5p和has-miR-514a-3p(图7b)。前5名下调的miRNAs分别是has-miR-4652-5p、has-miR-9-5p、has-miR-9-3p、has-miR-105-5p和has-miR-767-5p(图7b)。通过Kaplan–Meier曲线和对数秩检验,共获得14个对预后有显著影响的DE miRNAs(图7c)生信人。
图7簇3与簇4差异miRNAs筛选及预后分析(图片来源PMID:33148251)CeRNA网络分析
利用hub基因、DE lncRNA和DE miRNA构建CeRNA网络“AC079160.1-miR-539-5p-CENPF”(图8a)。CENPF的表达水平与AC079160.1表达、缺氧和干细胞指数呈正相关,但与miR-539-5p表达呈负相关(图8b)。miR-539-5p的表达水平与缺氧和干细胞指数呈负相关(图8b)。AC079160.1的表达与缺氧和干细胞指数呈正相关(图8b)。随后,分析了miR-539-5p和EGFR在不同簇中的表达。簇4中miR-539-5p的表达显著低于其他组,而簇4中EGFR的表达显著高于其他组(图8c,d)。
图8对预后有显著影响的hub基因、差异lncRNA和miRNA的ceRNA网络分析(图片来源PMID:33148251)在LUAD患者/样本中,CENPF发生了6%的扩增和7%的突变(图9a)。然而,生存分析显示CENPF的拷贝数变化并不影响患者的预后(图9b)。
图9 CENPF拷贝数变化的预测分析(图片来源PMID:33148251)结束语
总结一下,这篇研究从TCGA和GEO下载疾病和临床数据,用配对t检验筛选差异mRNA、lncRNA和miRNA,通过GO和KEGG通路对DE mRNAs的生物学功能进行表征,利用Cytoscape构建PPI网络,Kaplan-Meier曲线和log-rank检验用于预测lncRNA和DE miRNA对预后的影响,StarBase建立ceRNA网络。整体来讲,这篇文章真的可以说很简单啦,用了已经成型的Cytoscape、StarBase、cBioPortal 等工具来构建网络和分析,设计不繁琐,特别容易上手。
生信分析,数据挖掘,更多意向分析 可填写意向分析表
更多生信文章,https://biosxr.gaptools.cn/#/https://biosxr.gaptools.cn/#/
也可关注私信小编呦~
网友评论