美文网首页
7+非肿瘤纯生信,基于血小板相关基因结合机器学习建模,两个月接收

7+非肿瘤纯生信,基于血小板相关基因结合机器学习建模,两个月接收

作者: 生信小课堂 | 来源:发表于2023-10-04 17:07 被阅读0次

    背景和目的:类风湿性关节炎(RA)是一种可能导致严重残疾的自身炎症性疾病。由于需要具有可靠性和效率的生物标志物,RA的诊断受到限制。血小板与类风湿性关节炎的发病机制密切相关。本研究旨在确定相关生物标志物的潜在机制和筛选。

    方法:从GEO数据库获得了两个微阵列数据集(GSE93272和GSE17755)。进行了加权相关网络分析(WGCNA),以分析从GSE93272中识别的差异表达基因中的表达模块。作者先阐明血小板相关特征(PRS)。然后使用LASSO算法来开发诊断模型,使用GSE17755作为验证队列,通过操作特征曲线(ROC)来评估诊断性能。

    结果:WGCNA的应用确定了11个不同的共表达模块,模块2在分析的差异表达基因(DEG)中表现出与血小板的显著关联。此外,使用LASSO系数构建了一个由六个基因(MAPK3、ACTB、ACTG1、VAV2、PTPN6和ACTN1)组成的预测模型。由此产生的PRS模型在两个队列中都表现出出色的诊断准确性。结论:作者阐明了RA发病机制中发生的PRS,并开发了一个具有极佳诊断潜力的诊断模型。

    关于非肿瘤生信,我们也解读过很多,主要有以下类型
    1 单个疾病WGCNA+PPI分析筛选hub基因
    2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
    3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
    4 基于分型的非肿瘤生信分析
    5 单细胞结合普通转录组生信分析

    目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎交流

    研究结果:

    一、DEGs和血小板相关基因的鉴定

    作者获得了GSE93272的基因表达矩阵和临床数据,获得了3776个上调DEG和4714个下调DEG(图1A)。每个样本中DEG的表达式如图1B所示。

    二、通过WGCNA识别PRS

    使用样本聚类树来阐明异常值(图1C)。然后通过WGCNA中的“pickSoftThreshold”函数选择了软阈值β(图1D),并确定了模块(图1C)。软阈值设置为七。作者进一步开发了一个分层聚类树,每个分支代表具有相似表达和生物功能的基因(图1E)。此外,作者通过计算连接程度分析了阐明模块之间的相互作用(图1F)。


    三、模块的富集分析

    使用R中的“clusterProfiler”包进行了GO和KEGG分析,以识别与血小板关系最密切的模块,该模块被称为模块2。随后,作者对模块2进行了GO和KEGG分析,以确定血小板相关通路(图2A)。图2A所示的参与此路径的基因被确定为潜在的PRS候选者。为了更准确地确定血小板相关途径的活性,作者评估了模块2的GOBP PLATELET激活(图2B)和GOBP PLATELET聚合(图2C)的活性。


    四、PRS模型的构建

    从GSE93272获得了候选PRS的表达数据。作者使用LASSO算法推导出系数剖面图(图3A)和部分似然偏差(图3B)。从这些分析中,确定了六个非零系数特征,即MAPK3、ACTB、ACTG1、VAV2、PTPN6和ACTN1,用于构建风险评分模型。风险评分的公式如下:风险评分 =0.08×MAPK3 + 0.16×ACTB +0.27×ACTG1 + 0.25×VAV2 + 0.003×PTPN6 + 0.09×ACTN1。


    五、评估训练队列和验证队列中的诊断潜力

    作者通过计算这些队列中每个样本的风险评分来评估训练组和验证组中的PRS的预测能力(图4A,C)。随后,采用了ROC分析来确定模型的诊断潜力。训练组和验证组的AUC值分别为0.801(图4B)和0.979(图4D),这表明两个队列的诊断准确性都很出色。


    六、免疫相关状态和基因分析

    作者使用单样本基因集富集分析(ssGSEA)来分析免疫景观(图5A),发现激活的CD4/8 T细胞、效应记忆CD4 T细胞、嗜酸性粒细胞、γδT细胞、肥大细胞、骨髓源性抑制细胞(MDSCs)和浆细胞样树突状细胞在高风险组和低风险组之间存在显著差异。此外,作者利用GeneMANIA识别了与PRS最密切相关的前20个基因(图5B)。


    研究总结:
    本研究通过比较RA和健康对照样本中表达的基因,以确定与血小板相关的基因特征,该基因特征可以作为RA的潜在诊断工具。作者确定了3776个上调差异表达基因(DEG)和4714个下调DEG,识别了27个候选PRS基因,算法构建了一个PRS模型,该算法在GSE93272和GSE17755数据集中显示了RA和健康对照样本之间的出色诊断潜力。该结果可以为RA的发病机制提供新的见解,并帮助发现新的生物标志物,以改善诊断和治疗结果。

    相关文章

      网友评论

          本文标题:7+非肿瘤纯生信,基于血小板相关基因结合机器学习建模,两个月接收

          本文链接:https://www.haomeiwen.com/subject/zuiybdtx.html