美文网首页NGS
7+非肿瘤纯生信,使用机器学习识别狼疮肾炎中的核心基因。非肿瘤发

7+非肿瘤纯生信,使用机器学习识别狼疮肾炎中的核心基因。非肿瘤发

作者: 生信小课堂 | 来源:发表于2024-02-25 07:47 被阅读0次

    背景:狼疮肾炎(LN)是一种常见且严重的肾小球肾炎,通常作为系统性红斑狼疮(SLE)的器官表现发生,与LN相关的复杂病理机制阻碍了靶向治疗的进展。

    方法:从GEO数据库获得数据,分析了133名LN患者和51名正常对照患者的肾小球组织。识别了差异表达基因(DEG)并进行富集分析。还使用CIBERSORT分析了免疫细胞浸润。此外,作者调查了中枢基因与临床病理特征之间的关系,并检查了中枢基因在肾脏中的分布和表达。

    结果:在LN中共确定了270个DEG。将DEG集群到14个模块中。机器学习技术确定了四个中枢基因,即CD53(AUC=0.995),TGFBI(AUC=0.997),MS4A6A(AUC=0.994)和HERC6(AUC=0.999),它们参与炎症反应和免疫激活,这些中枢基因可能有助于免疫细胞的渗透。此外,这些中枢基因与LN的分类、肾功能和蛋白尿表现出很强的相关性。在巨噬细胞中观察到最高的枢纽基因表达评分。

    结论:CD53、TGFBI、MS4A6A和HERC6已成为LN有前途的候选驱动基因。这些枢纽基因有可能为LN的分子诊断和治疗提供价值。

    关于非肿瘤生信,我们也解读过很多,主要有以下类型
    1 单个疾病WGCNA+PPI分析筛选hub基因
    2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
    3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
    4 基于分型的非肿瘤生信分析
    5 单细胞结合普通转录组生信分析

    目前非肿瘤生信发文的门槛较低,欢迎有需要的朋友
    研究结果:

    一、识别LN和正常对照之间的DEG

    在对组合样本进行主成分分析(PCA)和分层聚类分析后,LN患者和正常对照患者之间明显有明显的区别(图2A)。此外,与正常对照组相比,LN患者的转录图谱表现出独特的特征,表明LN具有独特的状态(图2B)。进行了差异表达分析,在LN中鉴定了270个显著差异表达基因(DEG)。其中,214个基因表现出明显的上调,包括C1QA、IFI44L、TYROBP、MS4A4A和C1QB,已知它们参与免疫细胞激活和肾小球的炎症反应。此外,56个基因表现出明显的下调,包括ALB、UMOD、PCK1、CXCL14和DEFB1,它们与肾小球的结构、功能和代谢密切相关(图2C)。

    二、函数富集分析

    确定了LN中的几种浓缩途径,包括抗原处理和呈现、中性粒细胞细胞外陷阱形成、系统性红斑狼疮、补体和凝血级联以及NOD样受体信号通路。此外,LN中与细胞因子和趋化因子相关的信号通路明显上调(图2D)。观察到免疫反应的显著上调,包括免疫反应的激活、髓细胞白细胞激活和细胞因子介导的信号通路。相反,肾小球代谢,特别是小分子分解代谢过程、羧酸分解代谢过程、有机酸分解代谢过程和细胞氨基酸代谢过程,表现出明显下调(图2E)。


    三、LN的WGCNA网络的建设

    作者构建了一个基因层次结构聚类树状图,能够识别出14个表现出类似共表达模式的不同基因模块(图3B)。进行反应体通路富集分析。蓝色模块与线粒体翻译有关,而棕色模块则表现出与各种代谢过程的关系,包括氨基酸和金属离子代谢。绿色和黄色模块主要与细胞周期调节有关,包括AUF1结合、mRNA不稳定、有丝分裂末期和中期。此外,这些模块显示KEAP1-NFE2L2途径的富集,E3泛素连酶COP1的自动降解,以及通过蛋白酶体降解GLI1。绿黄色模块被发现参与细胞因子和趋化因子诱导的信号通路,特别是涉及趋化因子与白细胞介素和趋化因子受体的结合。这些模块表现出参与淋巴细胞和非淋巴细胞之间的免疫调节相互作用。(图3C)。在每个模块和表型之间进行了相关分析。我们的分析显示,由1063个基因组成的“绿松石”模块与LN的临床相关性最高。这一确定基于0.88的相关系数和2e-59的p值,表明模块特征值和LN表型之间存在很强的相关性(图3D,E)。此外,在“绿松石”模块中,基因重要性(GS)和模块成员(MM)之间观察到显著的相关性,相关系数为0.88,p值为1e-200(图3F)。因此,将“绿松石”模块确定为与LN相关的关键模块。此外,出现在DEG和绿松石模块中的基因被认为是LN的候选枢纽基因(图3G)。


    四、LN中枢纽基因的识别和验证

    应用了两种机器学习方法——LASSO回归和随机森林——来识别绿松石模块和DEG之间重叠的基因。LASSO分析确定了17个枢纽基因(图4A,B),而随机森林方法确定了27个枢纽基因(图4C,D)。发现CD53、TGFBI、MS4A6A和HERC6基因在这两种方法中都是共同的,因此被选为与LN相关的最终枢纽基因(图4E)。与正常对照组相比,LN患者的CD53、TGFBI、MS4A6A和HERC6显著上调,这表明它们在LN中的潜在作用(图4F)。计算了每个枢纽基因的操作特征曲线(AUC-ROC)下的面积,结果CD53为0.995,TGFBI为0.997,MS4A6A为0.984,HERC6为0.999(图4G)。这些中枢基因在LN患者中表现出更高的表达水平(图4H)。验证组中的AUC-ROC值分别为CD53为0.991,TGFBI为0.983,MS4A6A为0.979,HERC6为0.973(图4I)。


    五、枢纽基因的GSEA分析

    CD53与MHCI类蛋白质复合物组装、MyD88独立Toll样受体信号通路、淋巴细胞趋化调节、T细胞趋化和TRAIL激活凋亡信号通路等途径显著相关(图5A)。TGFBI与子突状细胞趋化、嗜酸性粒细胞趋化、GM-CSF生产、MCP-1生产的正向调节等途径表现出显著相关性(图5B)。MS4A6A与子突状细胞趋化、MHCII类蛋白质复合物组装、单核细胞趋化性、骨髓白细胞介导的免疫和Toll样受体2信号通路等途径显著相关(图5C)。HERC6与IFN-γ介导信号通路、MyD88独立Toll样受体信号通路、NLRP3炎症体复合物组装、对IFN-α的反应和对IFN-β的反应(图5D)等途径表现出显著的相关性。


    六、LN中免疫浸润分析

    LN患者显示浸润单核细胞、巨噬细胞M2、活化肥大细胞、记忆B细胞和γδT细胞(显著增加(图6A)。

    七、中枢基因与LN中浸润免疫细胞的相关性

    CD53与γδT细胞、静止树突状细胞、M1巨噬细胞和嗜酸性粒细胞的浸润呈正相关,同时与活性NK细胞、T NK细胞、Tregs、幼稚B细胞和CD8 T细胞的浸润呈负相关(图6B)。同样,TGFBI与活性记忆CD4 T细胞、M0巨噬细胞、γδT细胞、滤泡辅助T细胞、静息肥大细胞和嗜酸性粒细胞的浸润呈正相关。它与静息记忆CD4 T细胞和激活的NK细胞的浸润呈负相关(图6C)。此外,MS4A6A与M2巨噬细胞、激活记忆CD4 T细胞、γδT细胞和记忆B细胞的浸润呈正相关,同时与原始B细胞、静息记忆CD4 T细胞、Tregs和活化NK细胞的浸润呈负相关(图6D)。最后,HERC6与活化的子突状细胞、活化肥大细胞和单核细胞的浸润呈正相关,但与幼稚的B细胞和静息肥大细胞的浸润呈负相关(图6E)。


    八、中枢基因与LN的临床和病理特征之间的关系

    与III类LN患者相比,III类和IV类LN患者的CD53表达水平明显更高。当比较CD53表达水平显著升高的CKD第2阶段和第1阶段患者时,也观察到类似的趋势。虽然与1阶段相比,CKD第3期和第4期患者的CD53表达增加,但差异没有达到统计学意义。此外,发现CD53表达与蛋白尿之间存在相关性,与亚肾蛋白尿患者相比,肾性蛋白尿患者的水平明显更高(图7A)。与1阶段相比,CKD第2、3和4阶段患者的CD53表达相对较高,但差异没有达到统计学意义。此外,TGFBI表达与蛋白尿之间存在相关性,与亚肾性蛋白尿患者相比,肾性蛋白尿患者的水平明显更高(图7B)。与II类狼疮肾炎患者相比,III类狼疮肾炎患者的MS4A6A表达水平显著升高。然而,尽管与第1阶段相比,CKD第2、3和4阶段患者的MS4A6A表达较高,但差异没有达到统计学意义。MS4A6A表达与蛋白尿之间存在关联,与肾性蛋白尿患者相比,肾性蛋白尿患者的水平明显更高(图7C)。在HERC6表达和病理分类、CKD阶段或蛋白尿之间没有发现线性关系(图7D)。


    九、中枢基因在肾脏中的分布和表达

    共确定了21个免疫细胞簇(22个)。这些集群主要由巨噬细胞、树突状细胞(DC)、T细胞、自然杀伤(NK)细胞和B细胞组成,还发现了一簇上皮细胞(图8A)。CD53被发现广泛分布在免疫细胞中。相比之下,TGFBI主要在各种巨噬细胞亚群中表达,包括炎症性CD16+巨噬细胞(CM0)、吞噬CD16+巨噬细胞(CM1)、组织驻留巨噬细胞(CM2)、常规树突细胞(CM3)、M2CD16+巨噬细胞(CM4)和浆细胞样树突状细胞(CB2b)。同样,MS4A6A在CM1、CM2、CM3、CM4和CB2b中表现出主要表达。另一方面,HERC6在ISG高CD4+ T细胞(CT6)和ISG高B细胞(CB3)中表现出主要表达,在其他类型的T细胞和NK细胞中表现出较低的表达(图8B-E)。CM0、CM1、CM2、CM3、CM4和CB2b的得分最高,这表明这些细胞类型在LN中的重要性(图8F)。


    研究总结:本研究已经成功确定了270个DEG,为LN的具体转录概况提供了有价值的见解。作者特别关注了四个上调枢纽基因:CD53、TGFBI、MS4A6A和LN中的HERC6。它们与LN的不良后果密切相关。CD53、TGFBI、MS4A6A和HERC6在巨噬细胞、DCs和ISG高淋巴细胞中的表达与在LN中观察到的已知免疫细胞浸润模式相关。这些枢纽基因和免疫细胞群体有可能成为LN患者的免疫治疗目标,为治疗干预开辟新的途径,需要进一步研究来验证这些假设并探索其临床应用。

    相关文章

      网友评论

        本文标题:7+非肿瘤纯生信,使用机器学习识别狼疮肾炎中的核心基因。非肿瘤发

        本文链接:https://www.haomeiwen.com/subject/fdsoadtx.html