美文网首页
最新7.4分非肿瘤生信,热点基因集+机器学习+分型+PCR验证,

最新7.4分非肿瘤生信,热点基因集+机器学习+分型+PCR验证,

作者: 生信小课堂 | 来源:发表于2023-09-26 07:35 被阅读0次

    生信小课堂

    摘要

    背景:糖尿病肾病(Diabetic nephropathy, DN)是糖尿病的严重微血管并发症之一(DM)。越来越多的研究表明,炎症状态在DN的发生、发展中起着至关重要的作用。细胞焦亡是一种新的细胞程序性死亡方式,具有天然免疫炎症的特殊性。抑制炎症因子表达和调控细胞焦亡相关通路可能是DN治疗的新策略。本研究的目的是鉴定DN的焦亡相关基因和潜在药物。

    方法:通过GEO数据集GSE96804鉴定DN差异表达的细胞焦亡相关基因。下载数据集GSE30528和GSE142025验证下包焦亡相关的差异表达基因( DEGs )。采用LASSO回归分析构建细胞焦亡相关基因预测模型。进行一致性聚类分析,以确定与细胞焦亡相关的DN亚型。随后,通过GSVA、GO 功能富集分析和KEGG通路分析探索DN簇之间的差异。采用PPI网络筛选枢纽基因,并利用DGIdb数据库筛选靶向枢纽基因的潜在治疗药物/化合物。

    结果:在DN中共鉴定出24个差异表达的焦亡相关基因。通过LASSO回归分析构建16个基因预测模型。根据这16个基因的表达水平,将DN病例分为2个亚型,亚型主要与炎症、免疫应答的激活和细胞代谢有关。此外,作者在这些亚型中鉴定了10个hub基因,并预测了65个潜在的靶向关键基因的DN治疗药物。

    结论:作者鉴定了2个与细胞焦亡相关的DN簇和65个潜在的DN治疗药物/化合物,这可能为DN的治疗提供新的思路。

    图 1 研究流程

    关于非肿瘤生信,我们也解读过很多,主要有以下类型
    1 单个疾病WGCNA+PPI分析筛选hub基因
    2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
    3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
    4 基于分型的非肿瘤生信分析
    5 单细胞结合普通转录组生信分析

    目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎交流

    研究结果

    DN中细胞焦亡相关基因表达的定义

    作者从文献PMID: 33828074中获得了57个细胞焦亡相关基因,从MSigDB数据库中获得了Reactome基因集和GOBP基因集。然后利用GSE96804和GSE30528数据集探究了57个细胞焦亡相关基因在DN和正常肾脏组织中的表达情况。在DN中共有44个细胞焦亡相关基因表达。图2A显示了这44个细胞焦亡相关基因在染色体上的位置。为了进一步探究这些焦亡相关基因之间的相互作用,作者利用STRING平台进行了PPI分析,结果如图2B所示。PPI分析所需的最小交互评分设为0.900 (最高的置信度)。接下来,使用“limma”包,以P < 0.05和|logFC|> 1鉴定GSE96804中差异表达的细胞焦亡相关基因。共鉴定出24个差异表达的焦亡相关基因(图2C - E)。其中13个基因( CASP1、CASP3、CASP4、CASP8、GSDMB、IL18、NLRP1、PLCG1、TNF、NAIP、ZBP1、IRF1和TP53)上调,11个基因( CASP6、CASP9、GPX4、GSDMD、IL1B、PRKACA、GZMB、APIP、IL1A、CHMP2A、CHMP6)下调。


    图 2 DN中热解相关基因的特征及差异。

    为了进一步验证通过上述分析鉴定出的细胞焦亡相关基因,作者对GSE30528和GSE142025进行了分析。在24个DEGs中,4个基因(CASP1、CASP8、IL18和TP53)在GSE30528中表达上调(与GSE96804相同,肾组织样本为DN患者的肾小球解剖),10个基因(CASP1、CASP3、CASP8、NLRP1、PLCG1、NAIP、ZBP1、IRF1和TP53)表达上调,而在GSE142025中CASP9表达下调(图3A, B)。最后,4个与焦亡相关的基因(CASP1、CASP8、IL18、GSE96804和GSE30528中表达水平相同的TP53),应用肾小球系膜细胞qRT-PCR验证。如图3C所示,高糖(HG, 30 mM)组与正常糖(NG, 5.56 mM)组相比,CASP1、CASP8、IL18、TP53表达显著上调(P < 0.05)。


    图 3 来自数据集GSE96804的24个差异表达的热腐相关基因的验证。

    DN中焦亡相关基因表达的相关性分析

    利用“hmisc”包的rcorr函数计算GSE96804所有样品和DN样品中24个与细胞焦亡相关的DEGs的表达相关性。图4显示,TP53与IL18的表达呈显著正相关(所有样本:R = 0.703, P = 2.69e−10;DN样本:R = 0.771, P = 3.83e−09)。


    图 4 GSE96804中热解相关deg的相关分析。

    细胞焦亡相关基因预测模型的构建

    在上述24个细胞焦亡相关DEGs中,采用单因素logistic回归分析筛选DN相关细胞焦亡相关基因。所有24个基因均满足P  < 0.05的显著性,并保留用于进一步分析(图5A )。然后将这些基因应用到LASSO回归算法中,并根据最佳λ值(图5B , C)将16个基因纳入到预测模型中。根据风险评分公式,作者发现DN组的风险评分明显高于对照组( P < 0.001 ,图5D)。

    图 5 GSE96804数据集的风险模型构建。

    鉴定细胞焦亡相关分子亚群及亚群间免疫微环境差异

    为了探索16个细胞焦亡相关DEGs的表达与DN亚型之间的联系,作者对GSE96804数据集中所有41例DN患者进行了一致性聚类分析。通过将聚类变量( k )从2增加到10,发现当k = 2时,组内相关性最高,组间相关性较低,表明基于上述16个DEGs可以很好地将41例DN患者分为两个簇(图6A - C)。24例纳入细胞焦亡相关聚类 1,17例纳入细胞焦亡相关聚类 2。随后作者探究了16个细胞焦亡相关基因的簇间表达模式,发现16个基因中有8个基因( CAPS3、CASP4、CASP8、GPX4、IL18、IRF1、NAIP、PRKACA)在簇间存在显著的表达差异。聚类 1表现出更高的IRF1表达水平,而聚类 2的特征是CAPS3、CASP4、CASP8、GPX4、IL18、NAIP和PRKACA的表达增强(图6D , E)。此外,作者使用CIBERSORT算法,计算两簇间41个DN样本的免疫浸润评分,以确定22个浸润免疫细胞的相对比例。比较聚类1和聚类2的得分,发现有9种细胞存在显著差异。聚类 1浆细胞、活化NK细胞、单核细胞、M1巨噬细胞和中性粒细胞的浸润水平较高,活化CD4 T细胞、γδT细胞、M2巨噬细胞和静息肥大细胞的浸润水平较低,而聚类 2呈现相反的趋势(图6F)。


    图 6 基于细胞焦亡相关DEGs的DN分类。

    不同分子亚型的功能分析

    为了探究不同模式聚类在细胞焦亡介导的生物过程中的差异,作者进行了GSVA富集分析,发现聚类1主要富集于代谢相关通路,而聚类2主要富集于DNA复制和p53信号通路,如图7A所示。然后,在P < 0.05和log2(Fold Change) > 1的筛选条件下,作者进一步使用“limma”R包对两个集群的250个DEGs进行了识别。为了阐明这些基因的生物学特性,进行了GO和KEGG通路分析。显著富集结果包括231个生物过程(BP)项、21个细胞成分(CC)项和38个分子功能(MF)项。BP、MF和CC类别中显著富集的前20个条目如图7B ~ D所示,BP显著富集的DEGs包括补体激活、体液免疫应答和循环免疫球蛋白介导的体液免疫应答,CC显著富集的DEGs包括免疫球蛋白复合物、质膜外侧和含胶原蛋白的细胞外基质,MF显著富集的DEGs包括抗原结合、免疫球蛋白受体结合和细胞外基质结构成分。KEGG通路富集得到25条相关通路。通路富集到细胞外结构的组成、免疫细胞的活化、免疫球蛋白介导的免疫应答、体液免疫应答、免疫球蛋白复合物、细胞因子受体相互作用和自身免疫性疾病(系统性红斑狼疮),如图7E所示。


    图 7 不同DN簇的富集分析。

    基于差异基因的PPI网络构建及药物-基因相互作用预测

    为了进一步探索两个DN集群之间这250个DEGs的相互作用,作者使用Cytoscape软件进行了PPI网络,获得了182个节点和3261条边(图8A)。然后,使用cytohubba插件确定其中得分最高的前10个hub基因(图8B)。这些hub基因为ALB、C1QB、CD44、COL3A1、EGF、FN1、GPR183、HPGDS、NEGR1和SPON1,它们被用作治疗DN的潜在药物靶点。来自DGIdb数据库的药物-基因相互作用结果揭示了65种潜在的DN治疗靶点药物/化合物。图8C显示了从DGIdb数据库中根据“相互作用组评分”排序的前30名药物/化合物。其中针对ALB的药物有10种,预测得分最高;8种药物靶向HPGDS, 3种药物分别靶向EGF和FN1, 2种药物分别靶向C1QB和CD44, 1种药物分别靶向COL3A1和GPR183。未发现治疗NEGR1和SPON1的潜在药物。最后通过qRT-PCR对上述潜在靶点进行验证。


    图 8 基于差异表达基因簇枢纽节点的药物预测。

    如图9A所示,与正常葡萄糖(NG, 5.56 mM)组相比,高糖(HG, 30 mM)组C1QB、CD44、COL3A1、FN1、GPR183、HPGDS、NEGR1和SPON1的表达显著上调,而ALB和EGF的表达下调(P < 0.05)。此外,作者使用GSE96804、GSE30528和GSE142025数据集检测了这些基因在DN患者样本中的表达(图9B-D)。这些数据大部分与作者的实验结果一致。不同的是,GPR183和NEGR1在GSE142025中的表达无显著差异,ALB和COL3A1在GSE30528中的表达无显著差异,NEGR1在GSE30528中未检测到表达数据。


    图 9 10个hub基因的表达情况。

    结论

    综上所述,作者进行了全面系统的生物信息学分析,并确定了DN患者细胞焦亡相关的关键基因。本研究结果还根据两种细胞焦亡相关DN亚型之间的关键基因确定了65种潜在的DN治疗药物/化合物。需要进一步的研究来验证药物/化合物对DN的有效性。

    相关文章

      网友评论

          本文标题:最新7.4分非肿瘤生信,热点基因集+机器学习+分型+PCR验证,

          本文链接:https://www.haomeiwen.com/subject/znecbdtx.html