美文网首页
最新8.4分纯生信,基于机器学习筛选直肠癌中与放疗敏感性相关的基

最新8.4分纯生信,基于机器学习筛选直肠癌中与放疗敏感性相关的基

作者: 生信小课堂 | 来源:发表于2023-09-15 20:14 被阅读0次

    生信小课堂

    发表杂志:Journal of Translational Medicine

    影响因子:8.44

    本文投稿到接收仅一个半月!

    研究概述:
    放疗耐药是局部进展期直肠腺癌(READ)肿瘤低退的主要原因,而相关的生物标志物及其潜在的分子机制尚未完全阐明。

    本研究在READ放疗应答者中发现了DEGs和其中三个枢纽基因,统阐述了枢纽基因与肿瘤免疫浸润、免疫相关基因、化疗药物敏感性、特异信号通路、TF-miRNA-mRNA和ceRNA调控网络的关系。

    该文章其实与我们介绍的非肿瘤机器学习思路很类似,有需要做类似分析的朋友欢迎交流

    流程图:

    研究结果:

    一、READ 队列中辐射敏感样本的DEGs鉴定及功能富集

    1. 在GEO数据集GSE35452中,以P < 0.05为标准,READ放疗应答者与非应答者差异表达1119个DEGs。其中上调基因544个,下调基因575个。图1A 、B为DEG的火山图和热图。


    2. 采用metascape富集分析,这些基因主要富集在化学突触传递、激素水平调节和烯烃化合物代谢过程等途径中(图S1)。PPI网络分析:DEGs的网络连接紧密而复杂(图S2)。


    二、DEGs的随机森林分析及枢纽基因PLAGL2、ZNF337和ALG10的鉴定

    1. 选择TCGA-READ队列中的DEGs进行随机生存森林分析,确定相对重要性>0.3的基因为影响DEGs中直肠癌的核心基因,有8个基因符合筛选阈值,展示在图2A , B中。

    2. 通过Kaplan-Meier生存分析,其中只有3个hub基因具有统计学意义,分别为PLAGL2、ZNF337和ALG10,它们的高表达与更好的总生存期显著相关。(图2C、D、E)。

    3. 此外,这三种基因在放射治疗有应答的READ患者中的表达明显高于无应答患者(图F)。


    三、基于多组学研究,探索3个Hub基因的临床预测价值

    1. 分析枢纽基因表达与肿瘤免疫浸润的关系,进一步探讨影响直肠癌进展的潜在分子机制。

    图3A、B显示了每个患者的免疫浸润细胞比例以及不同免疫细胞之间的相互作用分析(* 代表 P < 0.05,** 代表 P < 0.01,*** 代表 P < 0.001 )。


    2. READ患者中CD4记忆激活T细胞、静息NK细胞和M0巨噬细胞的比例明显高于对照(图C)。ALG10与CD4记忆静息T细胞显著正相关,与Tregs显著负相关;

    PLAGL2与巨噬细胞M0、M1显著正相关,与巨噬细胞M2、静息树突状细胞显著负相关;

    ZNF337与巨噬细胞M0显著正相关,与巨噬细胞M2显著负相关(图D)。


    3. 此外,作者从TISIDB数据库中获得枢纽基因分别与趋化因子相关基因、免疫抑制剂相关基因、MHC相关基因、免疫刺激相关基因和受体相关基因之间的相关性。结果表明ALG10、ZNF337、PLAGL2与多个免疫相关基因呈正相关或负相关(图S3)


    4. 基于氟尿嘧啶的放化疗是局部晚期 READ 的标准治疗方法,使用R包“pRRophetic”进一步研究不同表达水平的hub基因对化疗药物的敏感性:

    ZNF337和ALG10的表达会影响紫杉醇、二甲双胍、苔藓生长抑制素1、达沙替尼、吉非替尼和伊马替尼的敏感性。PLAGL2对达沙替尼和伊马替尼的IC50没有影响。

    遗憾的是,GDSC数据库中没有氟尿嘧啶碱化疗药物的数据。

    四、研究三个枢纽基因与疾病相关基因的关系

    1. 通过GeneCards数据库获得与READ肿瘤发生相关的疾病基因。对照组和READ组有多个疾病相关基因的表达存在显著差异,呈现在图4A中。

    2. Pearson相关分析(图B)指出:ZNF337的表达与MET、MSH6、BRAF等呈正相关;

    PLAGL2的表达与MET、MSH2、CDH1等的高表达相关;

    ALG10的表达与BRCA1、APC、KRAS等的高表达呈正相关。


    五、三个枢纽基因具体信号通路及相关的疾病进展影响

    1. GSVA(图ABC)显示特定信号通路;GSEA(图D E F)显示疾病进展相关信号通路。

    2. ALG10的高表达主要富集于脂肪生成、UV-RESPONSE-down、细胞凋亡、PI3K-AKT-mTOR信号通路、NOTCH、G2M检查点等信号通路。

    ALG10的高表达富集于蛋白输出、RNA降解、泛素介导的蛋白水解等疾病相关信号通路。


    3. PLAGL2的高表达主要富集于UV - response-up、MYC靶向V2、氧化磷酸化和DNA修复等信号通路;低表达主要富集于凋亡、NOTCH、TGFβ和PI3K-AKT-mTOR信号通路。

    PLAGL2在胞吞作用、子宫内膜癌等信号通路中富集高表达,在氮代谢中低表达。


    4. 高表达的ZNF337主要富集于根尖连接、IL6-JAK-STAT3、IL2-STAT5、血管生成通路等信号通路。

    高表达的ZNF337富集在同源重组、GHRN信号传导等途径中。


    六、构建列线图并开发校准曲线以预测 READ 患者的预后

    1. 根据ALG10、PLAGL2、ZNF337的表达,结合年龄、性别、分期、肿瘤(T)、淋巴结(N)、转移(M)分期等临床特征,利用TCGA READ数据集构建列线图。临床参数及三个枢纽基因在不同阶段的READ评分过程中有不同程度的贡献。对特征进行评分,总分越高,1年和3年生存概率越低(图A) 。

    2. 1年和3年OS概率的校准曲线显示,列线图预测的OS与观测到的OS吻合较好(图B)。

    七、PLAGL2中枢纽基因调控网络分析和ceRNA网络分析

    1. 在预测相关转录因子TFs的过程中评估了三个枢纽基因,分析表明它们受到多个TF的调控,对这些TF进行基序富集分析(图7A)。最高的是NES为5.96的cisbp_M6542,其次是NES为5.94的cisbp_M4151,NES为5.92的cisbp_M0562(图7B-D)。


    2. cisbp_M6542 基序中富集的基因为PLAGL2,预测的上游TF为ZBTB6。建立了TF(ZBTB6)-mRNA(PLAGL2)调控网络。图E展示了部分富集的中心基因基序和相应的TFs。


    3. 从人类MicroRNA疾病数据库(HMDD)获得25种与READ相关的microRNA(miRNA)。首先,从miRWalk数据库中提取与三个枢纽基因的mRNA相关的mRNA-miRNA关系对,共获得1007个miRNA。仅保留与疾病相关的miRNA的mRNA-miRNA关系对,最后纳入两个mRNA和两个miRNA(图8A)。


    4. 根据两种miRNA,基于ENCORI数据库,共预测了157对相互作用,包括1个miRNA和157个lncRNA。结果表明,PLAGL2受到has-miR-133b的调控,利用细胞景观软件构建了miRNA (has-miR-133b)-lncRNA的复杂ceRNA网络(图B)。

    八、枢纽基因的GWAS分析

    1. 通过分析GWAS数据鉴定READ中3个枢纽基因的致病区(图9A、B)。

    2. 图9C-E展示了枢纽基因对应的单核苷酸多态性(SNP)致病区:PLAGL2和ZNF337位于20号染色体的致病区,ALG10位于12号染色体的致病区。


    九、验证临床样品中PLAGL2、ZNF337和ALG10的表达水平

    1. ZNF337在直肠正常组织的表达低;该数据库没有ZNF337在READ中表达的信息,转而鉴定其在结肠癌中的表达,然而未能检测到。

    2. ALG10在直肠正常组织的表达较高,在READ患者中表达水平从低、中到高不等。

    3. PLAGL2在直肠正常组织的的表达中等,在READ患者中表达水平也不同,从未检测到低表达到中高表达。

    枢纽基因的不同表达水平可能解释了READ患者固有的生物学特征差异和放射敏感性的个体差异。


    研究总结:

    READ中三个Hub基因PLAGL2、ZNF337和ALG10上调与肿瘤的放疗反应有关,并参与肿瘤细胞生物学的多个过程,可能是READ放疗敏感性和预后的潜在预测生物标志物。

    本文构建了包含临床病理特征和枢纽基因的预后列线图,建立校准曲线,较好地预测READ的生存率。这是初步但相对全面的研究,为理解READ的放射敏感性、预测潜在生物标志物和分子机制提供了新的视角。

    相关文章

      网友评论

          本文标题:最新8.4分纯生信,基于机器学习筛选直肠癌中与放疗敏感性相关的基

          本文链接:https://www.haomeiwen.com/subject/zzcbvdtx.html