美文网首页
最新6.7分非肿瘤纯生信,使用机器学习筛选慢阻肺中的关键基因。机

最新6.7分非肿瘤纯生信,使用机器学习筛选慢阻肺中的关键基因。机

作者: 生信小课堂 | 来源:发表于2023-12-09 09:28 被阅读0次

    生信小课堂


    关于非肿瘤生信,我们也解读过很多,主要有以下类型

    1 单个疾病WGCNA+PPI分析筛选hub基因。
    2 单个疾病结合免疫浸润,铁死亡,自噬等基因集,机器学习算法等。
    3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
    4 基于分型的非肿瘤生信分析

    目前非肿瘤生信发文的门槛较低,欢迎有需要的朋友患者

    研究背景:

    慢性阻塞性肺病是一种以持续性气流阻塞为特征的慢性肺部疾病,是中国第三大死亡原因。慢性阻塞性肺病的发病率稳步上升,已成为一种全球性严重疾病。因此,迫切需要探索如何及时诊断和治疗COPD。近年来,生物信息学分析和机器学习成为越来越有前景的策略,可以全面深入地分析转录组序列等大数据,跨学科领域渗透,在临床上开发更多的治疗方法。其中,现代计算机辅助医学的出现给这些不治之症带来了很多的指导和希望,如DBN算法(Deep Belief Networks)在COPD诊断中的。

    研究流程图:

    研究结果

    一、慢性阻塞性肺疾病早期和晚期DEGs的筛选

    1、利用“sva”R包对合并数据(GSE38974和GSE69818合并)队列中63例早期COPD样本和26例晚期COPD样本进行差异表达分析。

    2、在157个鉴定出的DEG中,有17个基因显著上调,11个基因显著下调(图2B)。

    3、在合并数据(GSE38974和GSE69818数据集)队列中,COPD早期和晚期的DEG热图和火山图如图2所示。


    二、DEGs关键信号通路的功能分析

    1、利用metascape数据库进行GO和通路分析,以确定DEG的生物学功能。DEGs主要参与炎症反应、管状形态发生、细胞外基质组织、细胞群增殖的负向调控、细胞对细胞因子刺激的响应、对细胞凋亡的正向调控,对外界刺激的反应(图3A)。

    2、DEGs也主要富集在NABA母体体相关的白介素信号通路网络图中。图3B显示了丰富项之间的关系。


    三、GSEA分析DEGs的生物学功能

    1、GSEA结果显示COPD早期主要富集扩张型心肌病、hcm肥厚型心肌病、黑素生成、紧密连接、血管平滑肌收缩(图4A)。

    2、在晚期COPD组织样本中,主要富集了氨基糖和核苷酸糖代谢、趋化因子信号通路、补体和凝血级联、细胞因子受体相互作用和原发性免疫缺陷(图4B)。


    四、EXPH5基因被鉴定为诊断性生物标志物

    1、最小绝对收缩和选择算子(LASSO)逻辑回归算法从DEGs中识别出19个与急性COPD相关的有意义的特征变量(图5A)。

    2、使用支持向量机递归特征消除(SVM-RFE)算法对整个DEGs中的16个特征进行分类,并识别出6个显著特征的子集(图5B)。

    3、得到四个基因,分析了它们在合并数据集中的表达水平(图5D, E, F, G),可以看出它们在COPD早期和晚期表达水平的差异。


    4、RRP9、CYP1B1、ZDHHC11在COPD早期和晚期样本中的表达水平无明显差异(图6B、C、D),而EXPH5在COPD晚期样本中的表达水平较早期明显下调(图6A)。

    5、为了进一步检验EXPH5的诊断效果,我们分别使用合并数据和GSE54837数据集进行了验证,ROC是评估诊断准确性和生存率的金标准。合并数据队列中EXPH5的AUC为0.916(图6E)。

    6、EXPH5在GSE54837数据集中的AUC为0.62(图6F),说明EXPH5具有明确的诊断价值。


    五、通过免疫细胞浸润分析,免疫细胞在两个阶段之间有明显变化

    1、通过CIBERSORT算法,计算出COPD早期和晚期免疫细胞浸润的比例(图7A)。

    2、晚期COPD患者B细胞记忆浸润程度(P = 0.043)、巨噬细胞M0浸润程度(P = 0.046)、巨噬细胞M1浸润程度(P = 0.037)明显高于早期COPD患者。相反,早期COPD标本中肥大细胞静息浸润(P = 0.019)、嗜酸性粒细胞浸润(P = 0.032)比例较高(图7B)。

    3、22种浸润免疫细胞之间的相关性(图7C)。


    六、EXPH5与浸润免疫细胞的相关性分析

    1、分析慢性阻塞性肺病晚期EXPH5表达水平与spearman免疫细胞浸润的相关性。EXPH5与几种浸润免疫细胞有显著相关关系(图8A-F)。


    七、EXPH5在单细胞转录组数据中的表达水平

    1、从NCBI GEO数据库下载GSE173896,进行归一化、缩放、聚类、高变基因筛选等。然后将这些降维聚类显示在基于这2000个高变异基因的t-distributed t-SNE after (PCA)生成的2D图上(图9A)。

    2、EXPH5在细胞簇表达图中可见(图9B和C)。


    总结:通过对COPD早期和晚期的比较,发现了许多不同的专注于炎症通路的基因,以及一个潜在的诊断标志物EXPH5,为临床诊断提供了更多的可能性。同时,COPD加重时,嗜酸性粒细胞或肥大细胞等免疫细胞以及AT1或AT2等肺细胞发生明显改变,这也为了解COPD疾病提供了新的思路。

    相关文章

      网友评论

          本文标题:最新6.7分非肿瘤纯生信,使用机器学习筛选慢阻肺中的关键基因。机

          本文链接:https://www.haomeiwen.com/subject/yuxygdtx.html