美文网首页文章套路R语言从零开始生物信息学从零开始学
一文重复一篇四分SCI------基于TCGA和geo的circ

一文重复一篇四分SCI------基于TCGA和geo的circ

作者: 柳叶刀与小鼠标 | 来源:发表于2019-11-25 22:38 被阅读0次


    这是一篇发表在4分左右sci的环状RNA文章

    摘要

    • 摘要背景:环状rna(circRNAs)在人类肿瘤研究中越来越受到重视。然而,仍有大量未知的环状rna需要被研究。本研究旨在探索新的环状rna及其在肝细胞癌(HCC)中的作用机制。
    • 方法:采用大数据挖掘、逆转录-定量聚合酶链反应(RT-qPCR)和计算生物学相结合的方法,对肝癌相关基因进行研究,探讨其可能的作用机制。采用CMap分析,探讨肝癌的潜在治疗药物。
    • 结果:采用RobustRankAggreg方法,从GSE78520、GSE94508和GSE97332三个基因表达全微阵列数据中获得6个不同表达的CircRNA。在RT-qPCR确证后,选择了三种环状rna(hsa-u-circRNA-u102166、hsa-u-circRNA-u100291和hsa-u-circRNA-u104515)进行进一步分析。预测了三种circRNAs的miRNA反应元件。共鉴定出5钟circRNA-miRNA相互作用,包括2种circRNA(hsa-circRNA-u104515和hsa-circRNA-u100291)和5种miRNA(hsa-miR-1303、hsa-miR-142-5p、hsa-miR-877-5p、hsa-miR-583和hsa-miR-1276)。收集上述5个miRNAs的1424个靶基因和3278个不同表达基因(DEGs)。通过miRNA靶基因与DEGs的交叉,我们获得了172个重叠基因。建立了一个基于172个基因的蛋白质-蛋白质相互作用网络,其中7个hub基因(JUN、MYCN、AR、ESR1、FOXO1、IGF1和CD34)由该网络确定。富集分析显示,这7个hub基因与一些与癌症相关的生物学功能和途径有关。此外,通过CMap分析,基于7个hubgenes的3种生物活性化学物质(德西他滨、BW-B70C和吉非替尼)被确定为肝癌的治疗选择。
    • 结论:本研究从circRNA-miRNA-mRNA网络的角度为肝癌的发病机制和治疗提供了新的思路。

    研究背景

    1976年首次发现的具有完全闭环结构的RNA。然而,由于传统RNA检测方法的局限性,这些没有poly-A尾巴的转录本长期被忽视。近年来,随着高通量测序技术的发展,在真核转录组中发现了大量的circRNAs。circRNAs具有细胞类型特异性和跨物种高度保守的特点,被认为是在多种疾病中起重要作用的新的星形rna,包括人类癌症。

    竞争性内源性rna(ceRNAs)是作为miRNA海绵的转录物,通过与其他miRNA的竞争性结合在转录后水平上相互调节。近年来,由于circRNAs具有丰富的保守miRNA反应元件(MREs),已成为ceRNA家族研究的新热点。越来越多的研究表明,ceRNA机制参与了肿瘤的发生和发展。例如,经典的cirRNA,ciRs7,被认为吸收miR-7并释放miR-7对许多人类癌症靶基因的抑制作用。CircRNAs作为ceRNAs介导的病理过程在HCC中也有报道。

    本研究采用基因芯片与计算生物学相结合的策略,探讨肝癌细胞中的新结构及其可能的作用机制。流程图概述了目前的工作,如图1所示:首先,我们从基因表达总集(GEO)收集了提供circRNAs表达谱的微阵列数据集,用RobustRankAggreg法获得不同表达的circRNAs(DECs),并用逆转录定量聚合酶链反应(RT qPCR)证实其表达。为了研究DECs在HCC中是否作为cerna发挥作用,我们收集了它们的海绵miRNA和miRNA靶基因,构建了一个circRNA-miRNA-mRNA网络。随后建立了蛋白质-蛋白质相互作用(PPI)网络并鉴定了hubgenes。然后,通过基因肿瘤学(GO)、京都基因与基因组百科全书(KEGG)和hubgenes的反应性富集分析,阐明HCC的潜在发病机制。此外,我们还进行了连接性图谱(CMap)分析,以获得治疗肝癌的生物活性化合物,这为进一步研究circRNAs在肝癌中的潜在治疗能力提供了新的视角。

    研究方法

    • 从GEO微阵列数据中筛选肝癌中的DECs
      提供HCC中circRNA的表达谱。所有的原始表达式数据都被规范化,log2被转换。首先,我们使用Limma,一个用于微阵列数据差异分析的生物导体包,以| log2(foldchange)|>1和P值<0.05为标准来确定每个数据集中的DECs。然后,我们用R包RobustRankAggreg对所有DECs进行了整合和排名。

    • 使用RT qqPCR方法验证
      对十六对新鲜冷冻的肝癌组织和相应的相邻非肿瘤组织进行验证,样本来自广西医科大学附属第一医院的HCC患者的诊断结果。这些患者术前未接受放疗或化疗。广西医科大学附属第一医院伦理委员会批准了这项研究。按照制造商的说明,使用TRIzol®试剂(美国赛默飞世尔科学生命技术公司)分离总RNA。然后,用Geneseed®II第一链cDNA合成试剂盒(Geneseed,中国广州)将1μg总RNA逆转为20μl互补DNA(cDNA)。RT-qPCR使用Geneseed®qPCR-SYBR®绿色主混合物(Geneseed)在ABI7500系统(美国加利福尼亚州Applied Biosystems)上按照制造商的程序进行。β-肌动蛋白(Geneseed)作为内源参考。本研究中使用的所有引物序列均由Geneseed合成,如表1所示。CircRNA的表达用2-ΔCT法测定。采用SPSS 22.0软件进行配对T检验,分析各组间的显著性。P值<0.05表示有统计学意义。

    • MREs的预测
      miRNA结合位点,也被称为MREs,是用两个网络工具CircRNA(CSCD)和circinteractiome预测出来的。我们将两种算法的重叠的miRNAs识别为DECs的潜在靶miRNAs。

    • 基于GEO和TCGA微阵列数据集的miRNA表达验证
      提供了肝癌miRNA表达谱,这些数据来自GEO和癌基因组图谱(TCGA)的公共数据库。检索公式: (hepatocellular OR hepatic OR liver OR HCC) and (“cancer” OR “tumor” OR “tumour” OR “carcinoma” OR “neoplasm” OR “malignan*”) and (miRNA OR microRNA OR miR OR “noncoding RNA” OR ncRNA OR “noncoding RNA” OR “non coding RNA”)。我们根据所列的纳入标准筛选了可用的数据集:(1)所有患者都被诊断为肝癌;(2)研究必须包含癌组织和正常肝组织中的circRNA表达数据;(3)肿瘤组和非肿瘤组的样本量至少为3。分别提取了每个收录记录的基本信息:miRNA类型、第一作者和发表年份、地区、数据源、平台、病例数、miRNA表达水平。用STATA 12.0(StataCorp,College Station,TX,USA)计算组合标准差(SMD)和95%可信区间(95%CI)。SMD>0代表肝癌组织中miRNA的高表达。相应的95%可信区间不超过1,P值<0.05表明有统计学意义。

    • miRNA靶基因的预测
      miRNA-mRNA的相互作用用miRWalk 2.0进行预测,涉及12种预测算法(Targetscan,rnahybridge,RNA22,PITA,Pictar2,miRWalk,Microt4,miRNAMap,miRDB,mirbridge,miRanda和miRMap)。选择至少8个算法预测的目标基因进行进一步分析。

    • 从TCGA数据库搜集差异基因 (DEGs)
      从TCGA下载了374份HCC样本和50份正常对照的TCGA-RNA序列(RNA-seq)不同表达基因(DEGs)数据。用edgeR包测定生物导体中的DEGs,过滤标准为| log2(foldchange)|>1,调整P值<0.05。

    • circRNA-miRNA-mRNA网络的构建
      预测的miRNA靶基因与DEGs的重叠基因用于circRNA-miRNA-mRNA网络的构建。使用Cytoscape 3.6.1软件可视化调控网络。

    • PPI网络的建立和hub基因的鉴定
      PPI网络是string数据库(v10.5)建立的,然后由Cytoscape 3.6.1软件进行可视化。然后,采用基于节点加权算法的“Molecular Complex Detection”(MCODE)来识别大规模PPI网络中的局部密集连接区域。

    • 富集分析
      用超几何分布法对聚类进行了GO注释和Kegg路径分析,并对基因群集的功能分类和富集进行了R包。Reactome路径分析是由Reactome Fi进行的,这是一种用于 network和pathway 分析的插件。

    • CMap分析
      Hubgenes包含两个上调和下调列表,上传到CMap网络工具中,与人类细胞系中1309种生物活性化合物治疗后的7000多个基因表达谱匹配。感兴趣的基因和来自CMap的化学品之间的匹配通过连接分数从-1到1进行评估:正分数表示化合物促进作用;而负分数表示化合物抑制作用。


    相关文章

      网友评论

        本文标题:一文重复一篇四分SCI------基于TCGA和geo的circ

        本文链接:https://www.haomeiwen.com/subject/oppkwctx.html