影响因子:6.6
关于基因集泛癌分析,我们也推过很多文章
我们可以综合各个文章中的内容,筛选新的基因集/复合物/通路/基因家族等进行分析。如果需要的话欢迎交流
研究背景: 焦亡是一种伴有炎症的程序性细胞死亡过程,“焦亡”是一种由caspase-1诱导的细胞死亡模式,可以迅速破坏细胞膜的完整性。一般来说,焦亡可分为典型途径和非典型途径(图1)。但是,焦亡相关基因(PRGs)很少收集于数据库。由于缺乏系统总结的PRGs,阻碍了基于生物信息学的焦亡研究。 在本研究中,该团队在最近发表的文章中整合了与焦亡相关的基因,以提供最全面的PRGs列表,并建立了一个基于31种癌症类型的焦亡基因风险预测模型,本研究的发现为改善免疫治疗结果提供了一种新的治疗策略,并为癌症细胞焦亡的研究奠定了基础。
图1 焦亡作用的示意图
结果解读:
一、焦亡相关基因的汇编
1、该团队通过GeneCards筛选出9个基因(CASP1、CASP3、CASP4、CASP5、CASP8、GSDMD、GSDME(DFNA5)、GSDMC、GSDMB)作为焦亡的核心因子。因IL-1β和IL-18的释放是细胞焦亡的特征之一,所以这两个基因包含在基因集中。
2、炎症小体的形成对于焦亡至关重要。故将参与炎症小体的基因列表进行筛选,将13个基因(AIM2、NLRP1、NLRP2、NLRP3、NLRP6、NLRP7、NLRP9、NLRP12、NLRX1、NLRC4、NOD2、TLR4和MEFV(Pyrin))附着在焦亡基因列表中。
3、还将已报道的具有焦亡功能或调控焦亡基因表达/功能的基因添加到基因列表中。得到了43个PRGs的列表(表S1)。43个基因在焦亡过程中的功能和串扰如图1 所示。
二、PRGs在癌症中的异常表达
1、该团队使用癌症基因组图谱(TCGA)数据来确定超过10,000例癌症病例中PRGs的表达变化(31种癌症类型)。癌症类型/数量和正常样本数量的缩写见表S2。
2、根据癌症类型对癌症组织和正常组织进行差异表达分析,结果表明PRG在不同癌症中表现出不同的表达变化(图2A)。
3、通过表达变化的加权评分,将31种癌症类型分为三类:“高分组”(>1),PRGs总体上调 (图2A红色标记);“低分组”(<−1) (图2A蓝色标记);“中分组”,PRGs的表达无明显变化(-1-1之间)(在图2A中用黑色标记)。
4、右边的条形图显示不同癌症类型中每个基因的倍数之和。在这31种癌症中,有22种癌症的得分>0,表明癌症中的PRGs增加,9种癌症的得分<0,则癌症中的PRGs减少。
5、对上述三个类别的生存曲线进行分析(图2B-D)。对于“高分组”,PRGs的表达量越高,患者的生存时间越长(图2B)。“低分组”,PRGs的表达量越低,患者的生存时间越长(图2C)。“中分组”, PRGs的表达与生存时间没有明显的关系(图2D)。
综上所述,在31种癌症类型中,PRGs的表达普遍失调,焦亡可能在不同的癌症类型中发挥不同的作用,对不同的癌症患者可能需要个体化的治疗策略。
图2 PRG的泛癌症分析
三、PRGs基因转录调控的泛癌性分析
1、 因许多具有复杂性状的人类疾病都与拷贝数变异(CNVs)和增强子密切相关。故结合TCGA RNA-Seq数据,计算miRNAs/增强子与其靶基因之间的表达相关性。
2、从TCGA中获得每种癌症类型中43个PRGs的“Segment_Mean”CNVs(图3A)。分析CNV区域内的频率和基因表达改变发现,在大多数癌症中,基因表达的增加或减少与CNV区域的扩增或缺失呈正相关。
3、通过GISTIC2将CNV的表达值阈值设置为−2、−1、0、1、2(分别代表纯合子缺失、单拷贝缺失、二倍体正常拷贝、低拷贝数扩增和高拷贝数扩增)。将43个PRGs分为“CNV组”(任何一个基因的拷贝数变化≠0)和“非CNV组”。通过分析受试者的生存时间发现,与之前的生存模式不同,对于低分组和高分组,CNV均显著降低了患者的生存时间;而在中分组,CNV对生存时间没有显著改变(图3B-D)。
4、利用starBase数据库推断出潜在的miRNA靶基因,并对miRNAs与PRGs之间的皮尔逊相关性进行统计学评估(图3E)。PRGs,如GSDME、GSDMD和CASP3,是多个miRNA的潜在靶点,表明PRGs的表达受到严格的调控。
5、eRNA(增强子RNA)的表达被用作增强子活性的指标。结合eRic数据库,确定了6个PRGs(GZMA、CASP3、CASP8、GSDMA、GSDMB和GSDMD)附近的8个不同的增强子。预测有三个增强子(GSDMD-enh1、GSDMD-enh2和GSDMD-enh3)调控GSDMD的表达。其中GSDMD-enh3增强子与GSDMD基因表达的相关性最强。在16种癌症中,GSDMD-enh3与GSDMD表达的相关性大于CNV与GSDMD表达的相关性,说明GSDMD基因表达的改变主要是由GSDMD-enh3基因调控(图3F)。
6、在各种癌细胞系的ChIP-Seq数据中,GSDMD-enh3周围有较高的结合峰,表明GSDMD上游存在潜在的增强子(图3G)。高通量染色体构象捕获(Hi-C)数据分析在染色体水平上验证了GSDMD-enh3和GSDMD之间的关联(图3G)。在HACER数据库中,GSDMD-enh3预计将通过USF1(上游转录因子1)转录因子与GSDMD结合。基于以上分析,预测GSDMD-enh3通过USF1调控GSDMD的表达,诱导GSDMD的焦亡。
图3 PRGs转录调控的基因组元件
四、基于PRGs表达的TCGA队列癌症预后模型的构建
1、大多数PRG生存分析中与DFS相关(图4A)。采用LASSO Cox回归分析,建立每种癌症类型的风险模型(图4B)。根据每种癌症类型的风险评分的中位数将患者分为不同的组:中位数以上的为高危组,低于中位数的为低风险组。
2、对于CHOL,因所有因素的影响都不显著,故未建立模型。由于样本量小(样本数<60),没有对DLBC和UCS组进行生存分析。在剩下的28种癌症类型中,低风险组的患者在26种癌症类型中的生存概率更长。为了检验由TCGA患者构建的模型的稳健性,国际癌症基因组联盟(ICGC)对BRCA和PAAD的数据也根据与TCGA患者相同的中位数分为高或低风险组。与TCGA队列相似,高危组患者的存活时间明显短于低风险组(图4C-F)。结果表明,风险生存模型具有良好的适用性,且风险评分作为DFS的预后指标是最佳的。
图4 PRGs的预后价值
五、基于风险模型探讨PRGs在免疫中的预后意义
1、使用风险模型建立不同癌症中所有基因的表达与风险评分之间的相关性。根据皮尔逊相关系数,将基因分为两类。第一类,基因与≥5种癌症类型的风险评分呈正相关,而与其他癌症类型无负相关。第二类,基因与≥5种癌症类型中与风险评分呈负相关,而在其他癌症类型中没有正相关。并进行GO(基因本体论)和KEGG富集分析,结果表明,它们的功能主要在免疫反应、炎症和细胞因子中富集(图5A,B)。
2、又分别评估了高危组和低风险组中31种癌症类型的免疫浸润评分和不同免疫细胞类型之间的比值。除三种癌症类型(KIRC、LUSC、TGCT)外,低风险组患者的浸润评分程度均不低于高危组(图5C)。通过计算CD8T细胞、CD4T细胞和巨噬细胞的比例发现,除DLBC外,不同癌症类型的CD4T细胞和幼稚CD4T细胞的比例与癌症患者生存率呈负相关(图5D)。因此,CD4T细胞与初始CD4T细胞的比例可以作为免疫浸润的指标。
3、使用ImmuCellAI(免疫细胞丰度标识符)和TIP(跟踪肿瘤免疫表型)分别量化肿瘤免疫侵袭程度和肿瘤免疫周期的富集评分。肿瘤免疫周期分为七个步骤。通过对不同步骤和Cox风险评分的测量发现,在大多数癌症中,焦亡影响免疫细胞向肿瘤的运输(图5E,细胞块显示为红色或蓝色)。
4、许多PRGs的表达,如GZMA和GBP家族基因,与免疫细胞的比例相关,而PRGs主要影响巨噬细胞、T细胞和B细胞的比例(图5F)。M0巨噬细胞的比例与GBP4和GZMA的表达呈负相关(蓝线),M1/M2巨噬细胞的比例与PRGs的表达呈正相关(红线)。结果表明,随着PRGs表达的增加,在大多数癌症患者中,M0巨噬细胞减少,而M1和M2巨噬细胞均增加;T细胞和NK细胞数量增加,而B细胞比例减少。
综上所述,焦亡更有可能通过改变免疫细胞的比例来影响癌症患者的生存时间,从而导致免疫微环境的改变。因此,焦亡的诱导可能会影响治疗结果。
图5 风险相关基因的功能分析
六、预测免疫治疗结果的探索
1、从GEO数据库中收集NSCLC(GSE78220和GSE115821)和黑色素瘤(GSE135222和GSE126044)免疫治疗的RNA-Seq数据,再使用Deseq2对这四个数据集进行方差分析。
2、表达倍数变化的>1.5和p<0.05的基因被定义为有和没有免疫治疗反应的患者之间的差异表达基因(图6A,B)。在43个患者中,有5个PRGs在4个免疫治疗应答者人群中高表达,包括CASP1、NLRP1、NLRP3、PYCARD和IRF2(图6C)。上述5个PRGs的预测能力显著大于ImmuCellAI (图6D)。
3、通过计算免疫治疗应答者中免疫细胞组成与基因表达之间的关系,CD4T、CD8T、DC、DC、巨噬细胞及NK细胞的比例分别与大多数癌症中CASP1、NLRP1、NLRP3、PYCARD和IRF2的表达呈正相关(图6E)。但是,这种相关性在癌症患者中并不显著(图5F)。在大多数癌症类型中,当这5个基因的表达上调时,肿瘤组织中的T细胞浸润得到改善,则有效地促进免疫治疗。
4、为改善免疫治疗的结果,收集使用小分子化合物(GSE96760)扰动24小时后的H-STS药物扰动数据集。在火山图上(图6F),红点对应的药物有效地促进了这5个基因的表达,而蓝点对应的药物则抑制了这些基因的表达。
5、从GSE165548(吉西他滨)和GSE131085(恩替司他)中收集RNA-seq数据。两种药物均刺激这5个基因的表达(图6F)。研究证实了恩替司他对免疫治疗的刺激作用,表明分析结果是可信的。
图6 PRGs对免疫治疗的影响
总结
焦亡是一种新特征的程序性细胞死亡类型。然而,它在癌症进展中的功能及其对治疗的反应仍存在争议。本研究广泛而系统地汇编了与焦亡相关的基因,整合了来自癌症基因组图谱的31种癌症类型的多组学数据和临床数据,并在转录水平上描述了PRGs的变化。通过整合来自基因型-组织表达和国际癌症基因组联盟的数据,阐明了拷贝数变异、miRNAs和增强子的潜在转录调控。还构建了一个基于31种癌症类型中PRGs表达的预后风险模型。为了研究焦亡在免疫治疗中的作用,通过探索免疫治疗患者的RNA-Seq数据,发现了5个与有效性相关的PRGs,并进一步确定了两种可能有利于免疫治疗的小分子化合物。本研究首次从焦亡的角度出发,建立了一种预测癌症患者生存和免疫治疗结果的新策略。
网友评论