又是新的一周了,春回大地,真是阳光明媚、鸟语花香但让人感觉不到春困是不是特别适合搞科研😁!今天呢,小编想给各位分享一篇于2021年1月22日新发在Frontiers in Oncology(IF:4.848)的关于消化道癌症的文章。
研究背景:
消化道是连接口腔到肛门的管道,消化道恶性肿瘤包括食道癌(ESCA),胃腺癌(STAD),结肠腺癌(COAD)和直肠腺癌(READ),均具有较高的发病率和死亡率。因此,探究消化道致癌的分子机制对于消化道癌症的早期诊断和治疗具有重要意义。
研究步骤及具体方法:
l数据的下载和预处理:
(1)数据下载:从TCGA数据库下载四种消化道癌症(ESCA、STAD、COAD和READ)的RNA-seq,miRNA-seq数据和临床数据;
(2)数据注释: 参考Gencode数据库来区分和注释RNA-seq数据中的mRNA和lncRNA;
(3)差异表达分析:使用Bioconductor中的edgeR软件包来筛选差异表达的miRNA、lncRNA和mRNA。
图一:四种消化道癌症差异表达mRNA, miRNA和lncRNA(顺序从左往右)的交集
l富集分析:
(1)GSEA分析:使用WebGestalt在线工具对差异表达的mRNA进行基因集富集分析(GSEA),以识别出四种消化道癌症的hallmarks;
图二:不同肿瘤的hallmarks
(2)GO和KEGG分析:使用DAVID对差异表达的mRNA进行GO和KEGG通路富集分析,以检测潜在的生物学功能和通路,并用cytoscape中的BiNGo插件来对结果进行可视化;
图三:GO和KEGG富集分析结果
l构建竞争性内源RNA(ceRNA)网络并分析:
(1)构建ceRNA网络:使用miRWalk 3.0数据库来预测差异表达的miRNA的靶mRNA,并对预测的靶mRNA和差异表达mRNA取交集;从miRcode数据库中获得lnRNA-miRNA关系对,同样对该lncRNA和差异表达的lncRNA取交集;使用cytoscape构建出ceRNA关系网络;
图四:ceRNA关系网络
(2)识别ceRNA调控轴:在ceRNA网络中去除正相关的lncRNA-miRNA对和miRNA-mRNA对,以识别潜在的ceRNA调控轴,并用R包ggalluvial对其进行验证;
图五:ceRNA网络中的调节轴
(3)生存分析:用R包survival的Log-rank检验来对ceRNA网络中的基因进行总体生存分析;
图六:SERPINE1 (C) , hsa-mir-145 (D) 和SNHG1 (E) 的总体生存分析
(4)分析网络中的高连通度lncRNA:对于具有最高连通性的lncRNA,使用GEPIA2数据库来分析其与mRNA的共表达关系,再使用ImmLnc数据库来分析其参与的与免疫相关的通路。
l构建基因共表达加权网络并分析:
(1)构建加权网络:使用R包WGCNA来构建基因共表达网络并鉴定共表达基因模块;
图七:识别消化道泛癌加权基因共表达网络中基因模块(不同颜色代表不同基因模块)
(2)识别网络中具有相同临床特征的基因 (common基因):结合四种癌症的临床数据来分析不同基因模块与临床特征之间的相关性,并且对于与同一临床特征相关的不同癌症的不同基因模块取交集以得到common基因;
图八:不同癌型基因模块与临床特征之间的相关性
(3)common基因的下游分析——构建和分析PPI网络:参照STRING数据库来对common基因构建PPI网络,并使用cytoscape中的MCODE来识别hub基因;使用UALCAN数据库分析hub基因表达与临床特征之间的相关性;使用Disease Meth 2.0和MethSurv探索了hub基因表达水平与其甲基化状态之间的关联;
图九:hub基因的识别及hub基因表达水平与临床特征的相关性分析
(4)common基因的下游分析——富集分析:使用Metascape和DAVID对common基因进行GO和KEGG途径富集分析,以检测其潜在生物学功能;
图十:GO富集分析结果
(5)验证:用TIMER2.0来验证ceRNA网络中的关键节点和hub基因是消化道癌症的共同特征。
研究结果:
(1)基于TCGA数据识别的ESCA, STAD, COAD和READ中的差异表达基因
ü识别出四种癌症共有的差异表达基因——1,700个mRNA,29个miRNA和362个长的非编码RNA(lncRNA)。
(2)四种癌症的基因集富集分析(GSEA)
(3)对common mRNAs进行GO和KEGG通路富集分析
(4)构建ceRNA网络
ü构建的ceRNA网络包含5个核心miRNA节点,21个lncRNA节点,21个mRNAs节点和66个边缘(如图四);
ü从ceRNA网络中选择负向相互作用来构建调控轴,包括16个lncRNA,5个miRNA和12个mRNA(如图五);
ü对于具有最高的连接性和共表达关系的lncRNA——SNHG14,ImmunLnc数据库显示其参与了免疫途径,例如抗原加工和呈递;
ü关联分析表明SERPINE1 , hsa-mir145和SNHG1与总体生存期显著相关(如图六),此外,它们之间还形成了潜在的调控轴。
(5)加权基因共表达网络分析(WGCNA)
üWGCNA阐明了20个与临床特征相关的基因模块。通过选取与同一临床相关的模块的交集,文章得到了ESCA和READ共有的67个common基因,并筛选了5个hub基因,包括ADCY6,CXCL3,NPBWR1,TAS2R38和PTGDR2。
文章回顾
该研究通过识别差异表达基因、构建竞争性内源性RNA (ceRNA) 网络、分析基因表达加权网络,发现了消化道癌症的潜在调控轴和几个重要的基因模块。hub基因ADCY6,CXCL3,NPBWR1,TAS2R38和PTGDR2在临床特征上的相似性较高,对年龄,组织学类型,肿瘤组织学等级以及ESCA和READ的总体存活率的临床特征有很大影响。并且对于这些消化道恶性肿瘤的临床治疗,SERPINE1 / hsamir-145 / SNHG1轴可作为预后生物标志物和潜在的治疗靶标。
更多生信文章可关注生信人网站 生信人
手机端可查询生信人小程序,添加手机桌面,方便阅览
、更多个性化生信意向可填写 表单 获取 生信分析意向表
网友评论