Novel insight on marker genes and pathogenic peripheral neutrophil subtypes in acute pancreatitis
对急性胰腺炎的标记基因和致病性外周中性粒细胞亚型的新认识
发表期刊:Front Immunol
发表日期:2022 Aug 22
影响因子:8.786
DOI: 10.3389/fimmu.2022.964622
一、研究背景
急性胰腺炎(AP)是一种临床上常见的危急疾病,随着全世界酗酒和肥胖的加剧,近年来AP的发病率激增。根据亚特兰大的AP分类标准,AP可以根据病情程度分为三个亚型,包括轻度急性胰腺炎(MAP)、中度重度急性胰腺炎(MSAP)和重度急性胰腺炎(SAP)。这三种类型的关键区别在于AP是否有短暂的器官衰竭或持续的器官衰竭。
大量的报告表明,COVID-19感染有可能导致AP。一些单中心研究已经证实了COVID-19和AP之间的这种关系。一些文献综述认为,感染COVID-19的患者AP的发病率增加,SARS-CoV-2本身可能导致一些患者的AP。其中,中性粒细胞已被证明与COVID-19免疫发病机制有关,包括干扰素(IFN)反应失调和骨髓炎症。
高通量测序数据的生物信息学分析在医学研究中发挥着重要作用。事实上,有一些基于AP的生物信息学分析的研究。加权基因共表达网络分析(WGCNA)是一种新型的生物信息学方法,用于识别具有相似表达模式的基因组(基因模块),并分析基因组和样本表型之间的联系。
二、材料与方法
1、数据来源
1) 在GEO中筛选了与AP和COVID-19感染的外周血相关的高通量批量测序数据集:GSE194331,包括87名不同严重程度的AP患者(轻度=57,中度至重度=20,重度=10)和32名健康对照者的外周血基因表达数据
2) 使用GSE152418数据集作为COVID组,包括17名COVID-19受试者和17名健康对照组
3) 单细胞测序数据集GSE157789,其中包括14个COVID-19诱导的72小时后的败血症样本,3个细菌诱导的72小时后的败血症样本,7个COVID-19诱导的7天后的败血症样本,以及2个细菌诱导的7天后的败血症样本
4) 2017年至2020年,从长海医院入院24小时内的AP患者获得外周血:28个样本被纳入我们的PCR分析,包括14个MAP、8个MSAP和6个SAP样本;这些样本被分为两组,包括MAP组和MSAP&SAP组
5) GSE194331(验证集)
2、分析流程
1) 差异表达基因的鉴定:使用R软件中的DESeq2包进行差异表达分析,以比较COVID-19与健康对照组的差异表达
2) 基因本体论和通路富集分析:使用Metascape进行基因本体分析、通路富集和枢纽通路鉴定;通过STRING数据库确定;使用Cytoscape软件对PPI进行可视化
3) 加权基因共表达网络分析:使用R WGCNA包对GSE194331数据集进行了WGCNA,选择17个作为基因模块的最小数量;从GSE198533和GSE152418数据集中获得BD样本和COVID-19样本的临床特征数据,通过WGCNA计算基因重要性(GS)和模块成员(MM);确定了具有共表达模式和意义的模块
4) 随机森林算法:R randomForest包,按健康对照、MAP和MSAP&SAP分组,使用随机森林算法来识别基于WGCNA的两个鉴定模块的枢纽基因
5) 免疫浸润估计和接收器操作特征曲线分析:ImmuCellAI,从基因表达数据集中估计24种免疫细胞丰度的工具
6) 聚合酶链反应
7) 单细胞测序数据的分析:单细胞转录组矩阵数据集GSE157789;前2,000个高变量基因,构建tSNE和UMAP的基础是前10个PCA;通过基于图的聚类方法获得了基于前10个主函数的无监督细胞聚类结果
8) 不同中性粒细胞类型中明显相关的通路的鉴定:使用R软件中的 "irGSEA "包评估基因集是否在中性粒细胞亚群中富集
9) 伪时间分析:Monocle2;在伪时空分析的基础上,使用分支表达分析模型(BEAM分析)来分析分支命运决定的基因
10)在单细胞水平上识别重要的代谢途径:R "ScMetabolism "包被用来计算中性粒细胞数据集中不同细胞类型之间的代谢状况
11)急性胰腺炎患者和健康对照组外周血批量测序数据中的单细胞测序估计的亚型
三、实验结果
01 -通过WGCNA识别急性胰腺炎的关键基因模块
GSE194331数据集包括以AP患者为疾病组(57个轻度胰腺炎样本,20个中度重度胰腺炎样本,10个重度胰腺炎样本),以健康志愿者为健康对照组(32个样本)的外周血mRNA表达数据,通过DEseq2软件包进行差异表达分析(图1A),共鉴定了1064个DEGs。如图1B所示,前50个上调和下调的基因的转录表达可以区分大部分疾病样本,特别是重症样本,与健康样本(图1B)。"中性粒细胞脱颗粒"是在输入基因列表中富集术语的柱状图中发现的一个重要途径(图1C)。"对刺激的反应 "是GO分析中最明显的术语(图1D)。这些术语强调了中性粒细胞在AP发生中的关键价值。PPI分析表明,存在一些密度显著的模块,包括与IL-1R1、IL-1RN、IL-1R2、IL-10和MMP1的模块,与HIST家族基因的模块,以及与MAPK相关基因的另一个模块(图1E)。IL-10、IL-6、OSM、MMP9、MMP1、LCN2、HGF、TIMP1、IL1B和HIST1H4F被确定为前10个富集的基因(图1F,G)。

为了进一步明确正常外周血和不同的AP亚型(MAP、MSAP和SAP)之间的潜在机制和基因模块,在批量归一化后对两个数据集的疾病样本进行了WGCNA(图2A)。如图2B、C所示,所有的样本都被包括在内。棕色模块和绿松石模块是两个重要的基因模块,分别与AP的严重程度呈负相关和正相关(图2D)。其他基因模块具有紧凑的基因调控网络(图5C)。WGCNA的结果表明,棕色模块和绿松石模块中的基因操纵着AP的共同生物过程。

02 - 筛选基因模块中关键GO术语和KEGG通路的研究
为了进一步调查所确定的模块中的基因功能和重要的KEGG途径,使用了Metascape数据库。与T细胞激活和病毒感染有关的 "RNA的代谢 "途径在绿松石模块中明显富集。绿松石模块的路径网络显示,这三个方面的相关路径独立作用(图3A)。此外,"中性粒细胞脱颗粒"、"炎症反应"和 "对细菌的反应 "在棕色模块中明显富集。绿松石模块的路径网络显示,这些相关的路径发挥了协同作用(图3B)。

03-急性胰腺炎中免疫细胞亚型和可靠生物标志物的鉴定
在免疫细胞类型浸润分析中,结果表明,随着AP的进展,外周血DCs、单核细胞、巨噬细胞和中性粒细胞呈上升趋势,而B细胞、CD4 T细胞、CD8 T细胞、Treg细胞、T辅助(Th)细胞、Th1细胞、Th2细胞和Tfh细胞呈下降趋势(图4A)。然后,在严重AP组(MSAP&SAP)和对照组(健康对照和MAP)之间执行随机森林分析(图4B)。前30个基因被列出(图4C)。在这些基因中,有10个基因,包括S100A6、S100A9、S100A12、CD63、ITK、CD5、ANXA3、KLF12、TRABD2A和CCR7,被确认具有重要的诊断价值(图4D)。

如图5A所示,所有八个基因在健康对照组、MAP组和MSAP&SAP组之间都有明显的差异。由于检测错误率较低,表达量较高的基因更适合作为诊断因素。按照这一标准,筛选出三个具有重要价值的基因作为诊断因子(最小相对表达量>500),包括S100A6、S100A9和S100A12。为了测试这些基因在鉴定AP严重程度方面的稳健性,作者收集了28份外周血样本,并检测了这些基因的相对表达。患者按AP的严重程度进行分组(MSAP&SAP组和MAP组)。在这两组中,所有基因的表达值都有明显的差异(图5B)。ROC分析也验证了这些基因在SAP和MAP之间具有明显的诊断价值(图5C)。

04-识别急性胰腺炎和COVID-19之间的共同生物过程和关键的外周血细胞类型
为了进一步探索COVID-19诱导的胰腺炎的共同生物学过程和关键细胞类型,在以下研究中使用了GSE152418数据集。通过DEseq2软件包共鉴定了1494个DEGs,在AP和COVID-19患者的外周血中共发现161个共同上调的基因和12个下调的基因(图6A)。在这些常见基因的KEGG通路分析中,"中性粒细胞脱颗粒 "被显著富集(图6B)。"中性粒细胞脱颗粒 "途径在网络的中心作用中被确定为最有意义的价值(图6C,D)。

05-单细胞数据集中中性粒细胞类型的鉴定
以前的研究表明,COVID-19诱导的败血症可以潜在地诱发和加速AP。然而,目前还没有与细菌诱导的败血症(另一种常见的败血症原因)有关的报道。根据上述分析,中性粒细胞可能是一个重要的亚型,作为COVID-19感染和外周血中AP的共同致病因素。因此,接下来通过分析单细胞测序数据来研究细菌引起的败血症和COVID引起的败血症之间中性粒细胞的变化,以确定COVID-19引起的AP中外周血的致病因素。如图7A所示,在以下步骤中选择0.05作为分辨率。第1、6和9组被确定为中性粒细胞(图7B-D)。

然后,对确定的中性粒细胞进行筛选,并提取到以下分析中。确定了五个中性粒细胞亚组(图8A-C)。如图8D所示,0组在COVID-19组中明显上调,3组在细菌诱导的败血症中明显增加。每组的前10个基因被筛选出来(图8E)。重要的是,第0组的top基因与IFN反应性表型和炎症有关。第3组和第4组更有可能表现出增殖型表型。中性粒细胞脱颗粒与中性粒细胞的激活明显相关。中性粒细胞脱颗粒的标志基因是MPO、ELANE、CAMP、CYBA、MMP8和MMP25。如图8F所示,中性粒细胞脱颗粒的标记基因在0组中明显上调。综上所述,0组代表成熟的活化中性粒细胞的一个亚型,主要在COVID-19诱导的败血症中富集,IFN相关基因高表达。

06- 0组中性粒细胞是急性胰腺炎的潜在致病亚型
最后,通过单细胞通路分析验证后,0组被确定为IFN相关组(图9A,B)。伪时间位点分析说明,第5组代表了败血症中中性粒细胞的幼稚和失活表型,第0组的进化轨迹与其他成熟中性粒细胞不同(图9C,D)。然后,在第0组中确定了一些共同的代谢相关途径,包括 "脂肪酸降解"、"α-亚麻酸代谢"、"硫代谢"和 "脂肪酸生物合成"(图9E,F)。最后,为了进一步验证确定的IFN相关的中性粒细胞致病亚型,使用cibersoftx软件从AP患者和健康对照组中所有中性粒细胞的单细胞测序数据中估计确定的亚型的比例(基于前GEO批量测序数据集:GSE194331)。该亚型的比例在健康对照组的外周血中几乎为0,在AP患者的外周血中明显上调,随着疾病严重程度的增加而上升(图9G)。

四、结论
作者首次对100多个人类血液样本的测序数据进行了WGCNA,分为健康组、MAP组、MSAP组和SAP组,并确定了功能基因模块。然后,通过机器学习方法确定了功能基因模块中具有重要诊断价值的关键基因。最后,研究了COVID-19诱导的AP的潜在机制和致病的中性粒细胞亚型。这些结果有助于急性胰腺炎的预后预测和COVID-19诱发的急性胰腺炎的研究。
网友评论