今天小编要和大家分享一篇今年9月发表在 Briefings in Bioinformatics (IF:11.622)杂志上关于干性的预后分析文章。
Characterization of gastric cancer stem-like molecular features, immune and pharmacogenomic landscapes
胃癌类干性分子特征、免疫及药物基因组学图谱
一.研究背景
癌症干细胞(CSCs)假说定义其为肿瘤细胞的一个亚群,该亚群通过分化和自我更新来维持肿瘤异质性,从而促进肿瘤生长和治疗耐药,这可能会对预后和免疫治疗产生重要影响。然而,目前针对胃癌类干性细胞(GCSC)微环境图谱的认识还有待于进一步的提高。因此今天小编和大家分享的文章就针对胃癌的类干性分子特征、免疫及药物基因组学图谱进行了分析。
二.数据及方法
1. 数据的收集及处理:研究中作者收集了五个原发性胃癌的队列,包括来自GEO的四个芯片数据集及TCGA的RNA-seq数据集。作者也回顾性的分析了来自六个数据集的免疫治疗基因表达谱。以及包括GSE91061、GSE78220、PRJEB25780及PRJEB23790的转录组数据,研究也收集了IMvigor210队列以及 MGSP。研究也收集了来自武汉大学中南医院的96例根治性胃癌切除术患者的原发性胃癌组织样本及手术数据。同时研究也收集了三个具有正常和类干性特征的癌细胞系的队列:GSE112631、GSE36821和GSE130575。作者也获取了相关数据的临床数据及肿瘤突变负荷、新抗原负载、同源重组修复以及杂合缺失等数据。
2. 选择候选基因及构建GCSC相关得分:研究利用一类逻辑回归(OCLR)评估每个胃癌样本表达谱的mRNAsi,其能够用来衡量样本的干性程度。使用KM分析评估预后。使用加权基因共表达网络分析(WGCNA)识别与mRNAsi相关的基因模块。接下来应用Cox回归模型及LASSO构建预后模型,最终识别到五个基因构建了GCScore得分。
3. 功能及通路富集分析:分析中使用clusterProfiler对基因进行GO及KEGG注释。同时也进行了GSEA及GSVA分析确定不同组的上调及下调通路。
三.研究的主要内容及结果
1. 评估mRNAsi及识别最显著基因
在文章的第一部分作者首先介绍了研究的流程(图1A),接着使用一类逻辑回归算法(OCLR)评估了GSE62254队列的mRNAsi,如图1B所示,可以观察高mRNAsi患者倾向于晚期,且与更差的预后及微卫星稳定(MSS)亚型有关。接着作者使用KM分析评估了mRNAsi的预后价值如图1C所示。 作者也使用WGCNA确定了CSC相关基因,这些基因被聚类到27个模块,作者选择了与mRNAsi最相关的模块,并识别mRNAsi组中的关键基因。

2. 在胃癌队列中构建及验证基于五个基因的GCScore
在文章的第二部分,作者对前面识别的关键基因应用LASSO COX及十倍交叉验证来产生预测基因,并评估了每个模块的频率,如图2A所示最终得到的最优模块包含五个基因。接着作者基于这五个hub基因通过无监督聚类将TCGA STAD队列分成两类(图2B)。作者通过K-M分析发现这两类的OS具有差异(图2C),这也证明了这五个基因对于胃癌的预后能力。接下来作者收集了独立的正常及类干性癌细胞系的基因表达数据集,并基于这五个基因评估了每个样本的CSC得分。结果发现具有干性特征的样本展示出了更高的CSC得分(图2D)。这些结果也暗示了这五个基因的鲁棒性。作者将最终构建的signature命名为GCScore,其是由这五个GCS相关基因的mRNA表达水平及风险系数得到的。接下来作者将GSE62254队列基于GCScore分成两组,同时其他队列作为独立测试集。图2E展示了训练集中这五个基因与GCScore的相关性网络。作者发现在训练集中,高GCScore组有更差的预后(图3A)。图3B展示了患者的GCScore分布及其与生存时间的相关性,图3C则展示了ROC曲线。接着作者又进行多因素分析对风险得分的独立性进行了验证(图3D)。图3E展示了GCScore在测试集中的效能,同时在中南队列中GCScore也展示出了预后效能(图3F,G)。


3. GCScore相关的肿瘤分子特征
在文章的第三部分,作者为了刻画GSE62254队列中预后不良的高GCScore组相关的表型,作者对高的分组相对于低的分组基因排序执行了GSEA分析(图4A)。接着作者为了验证GCScore的准确性,选择了一些代表性的CSC markers,结果发现GCScore与它们的表达水平相关(图4B)。接下来作者选择top1000的差异基因进行GO及KEGG分析,发现富集结果与CSC相关(图4C)。图4D的热图展示了高GCScore组与CSC激活更相关。接着作者对TCGA-STAD队列高低组进行了富集分析,结果如图4E,F所示。

4. 高低GCScore患者之间的免疫细胞浸润
研究已经发现TME中的免疫浸润细胞可以调控肿瘤表型。因此在文章的第四部分作者对高低GCScore患者之间的免疫细胞浸润进行了分析。研究使用ESTIMATE评估所有GSE62254样本的基质及免疫细胞浸润。结果发现高GCScore组展示出更低的基质及免疫细胞丰度,这揭示了GCScore与肿瘤纯度相关(图5A)。接着作者为了进一步刻画免疫细胞,使用CIBERSORT算法推断GSE62254队列中高低GCScore患者的细胞丰度,结果观察到高GCScore组与高水平的激活适应性免疫细胞及如M2巨噬细胞等免疫抑制细胞有关(图5B,C)。

5. 浸润边缘的CD206+ TAMs增强了胃癌细胞干细胞特征
在这一部分作者为了进一步探索能够影响CSC特征和预后的M2巨噬细胞亚型,分析了GSE622545队列中GCScore及M2巨噬细胞的代表性markers之间的关系,结果发现GCS与CD206显著相关。接下来作者为了进一步确定TME中能够影响干细胞比例的不同TAMs分布,首先在中南队列结合免疫组化实验验证蛋白质水平,结果发现在浸润边缘(IM)区域高GCScore指向一个更高CD206+TAM比例,而在肿瘤区域没有观察到这个现象,作者接着使用关联分析进一步验证这一现象。
6. GCScore与内在免疫逃逸机制的关联
在这一部分,作者对免疫逃逸机制与GCScore之间的关联进行了分析。首先作者使用IPS得分评估不同GCScore组中免疫治疗的免疫系统激活,结果与ESTIMATE结果一致,高GCScore组展示出更高的抑制细胞得分及更低的抗原呈递得分(图6A)。接下来作者进一步比较高低GCScore组中癌症免疫相关panel基因的表达水平(图6B)。作者分析也发现CD276、VISTA及PDL2展示出与GCScore得分显著相关(图6C)。接下来作者探索了GCScore和TCGA队列中包括肿瘤突变负荷、新抗原负载、同源重组缺陷、杂合缺失及CT抗原水平在内的肿瘤免疫原性之间的关系,结果如图6D所示。

7. GCScore能够预测治疗应答
在这一部分,作者进一步探索GCScore是否能够预测患者的免疫治疗获益,作者将接受免疫治疗的五个队列患者分为高低GCScore组,结果发现高GCScore组的预后更差(图A,B)。接下来作者评估了不同免疫治疗应答组中GCScore得分的分布发现应答差的患者中得分更高(图7C),作者也观察到TMB及TNB结合GCScore会提高免疫应答预测率(图7D)。此外,GCScore的预测值也远超PD-L1(图7E),作者也验证了GCScore的预后预测价值。在IMvigor210及MGSP队列中也观察到高GCScore组展示出TAAS组表达更低(图7G),而GCScore高的组中PD-L1表达也更低(图7 H)。作者还分析了已知的免疫治疗相关基因发现高CSC表型与EMT状态、CD8+ T细胞减少和增加TAMs浸润密切相关(图7I)。

8. GCScore相关的潜在药物靶点和治疗化合物
在文章的最后一部分,作者为了识别高GCScore患者的治疗靶点,收集了2250个相关的化合物靶点并进一步结合关联分析识别了1215个潜在靶点(图8A)。接着作者通过胃癌细胞系分析了CERES得分及GCScore的相关性进一步识别靶点(图8B)。这两步分析作者识别到了四个潜在的治疗靶点。接下来作者分析CTRP、GDSC及PRISM数据库识别候选药物,图8C展示了CTRP相关的化合物,图8D展示了PRISM相关的化合物,而图8E展示了GDSC相关的化合物。作者也分析了这些化合物的信号通路及治疗靶点结果如图8F所示。此外作者也在细胞系中进行了药物敏感性实验进一步验证(图8G)。

到这里这篇文章的主要内容就介绍完了,文章中构建了干性相关风险得分,尽管是经典的预后模型思路,但文章纳入了多套数据集,并结合免疫、药物等多个角度对风险得分进行刻画,使文章内容充实。可见在预后模型中结合多角度刻画使工作丰富会非常加分呀。
更多精彩好文可关注生信人公众号
网友评论