HCC subtypes based on the activity changes of immunologic and hallmark gene sets in tumor and nontumor tissues
基于肿瘤和非肿瘤组织中免疫学和标志基因组的活性变化的HCC亚型
发表期刊:Brief Bioinform
发表日期:2021 Jan 30
影响因子:8.990
DOI: 10.1093/bib/bbaa427
一、研究背景
肝细胞癌(HCC)是最常见的肝癌类型之一,是全球癌症相关死亡的第四大原因。由于HCC侵袭性死亡率高、预后差,识别HCC亚型和预后基因组可以通过个性化医疗和准确评估预后改善患者的治疗效果。
以往大多数关于将HCC分层为不同亚型或预后基因组的研究主要集中在HCC本身,而大大淡化了非肿瘤组织在HCC亚型中的作用。在一些HCC治疗后,如手术切除后,残余的肝细胞会增殖,如果残余的肝脏仍有可导致肝癌的基础疾病,有时会出现肝癌发生。此外,血液中的循环肿瘤细胞可能通过血管,成功地定植于残余肝脏而诱发复发,这可能受到邻近非肿瘤组织的免疫学和分子变化的影响。因此,这些非肿瘤组织也可能对HCC的预后产生实质性影响。
二、材料与方法
1 数据来源
1)GEO数据库:GSE14520和GSE76427,HCC组织和相邻非肿瘤组织的样本量均≥50
2)GSEA网站:4922个免疫和标志基因集
2 分析流程
流程图三、结果展示
01 - HCC和邻近非肿瘤样本中免疫学和标志基因组的活性变化
为了全面揭示HCC和相邻非肿瘤样本中免疫和标志基因集的活性变化,首先从GSEA下载了4922个免疫和标志基因集和基因表达谱数据(GSE14520,N=213,T=213)。免疫学基因集是由免疫学研究的微阵列基因表达数据定义的,而标志基因集是由聚合许多MSigDB基因集得出的连贯表达标志,这些标志代表了明确定义的生物状态或过程。
基于GSE14520的表达数据,通过GSVA计算4922个基因集的富集度得分(ES)(图2)。在HCC和相邻的非肿瘤组织中,一些基因组似乎可以将样本分为几类。
图2 HCC和相邻非肿瘤样本中免疫学和标志基因集的富集得分热图根据HCC和相邻非肿瘤样本中免疫学和标志基因集的ES(肿瘤组织中的基因集=4922;非肿瘤组织中的基因集=4922),试图将HCC患者分为不同的亚型。由于预后信息不完整,4例患者(GSE14520)被剔除作进一步分析。
通过CancerSubtypes软件包,采用Cox回归模型进行特征选择,保留999个特征进行进一步分析。利用factoextra软件包生成最佳聚类数(K)(K=3,图3A和B)。通过NMF(非负矩阵分解)法,将HCC患者聚类为三种不同的亚型(图3C)。在轮廓宽度图中,轮廓宽度值为0.64(图3D),说明HCC样本与其识别的亚型相比,与其他亚型的匹配度很高。有趣的是,亚型1的HCC患者表现出良好的总生存期,而亚型2和亚型3的预后较差(图3E)。
图3 鉴定HCC的临床相关亚型02 - 临床特征与HCC亚型的相关性
作者进一步探讨了临床特征与HCC亚型之间的相关性。1亚型的HCC患者 与2和3亚型的患者相比,往往寿命更长,复发率更低(图4A)。为了找出每个亚型的代表性基因集,计算了两个亚型之间基因集的差异性ES,并将它们进行交叉(折合变化>1.2或<0.83,假发现率<0.05)。图4B中,亚型1有12个不同的基因集,亚型2有59个,亚型3有22个。
图4 基因组与临床特征之间的相关性代表性基因集与临床特征的相关性如图5所示。亚型1在非肿瘤样本中9个基因组的ESs高于其他亚型,如N_GSE557_CIITA_KO_VS_I_AB_KO_DC_DN,亚型2在非肿瘤样本中一些基因组的ESs也较高,如N_GSE24634_TEFF_VS_TCONV_DAY10_IN_CULTURE_UP。与这两种亚型相反,亚型3在肿瘤组织中18个基因组的ES增加,如T_HALLMARK_MITOTIC_SPINDLE。
图5 三个亚型中代表的免疫和标志基因集的热图由于包含配对肿瘤和非肿瘤样本的表达和临床信息的阵列太小,作者选择另一个不同阵列平台的基因表达谱数据(GSE76427,N=50,T=50)来验证分类。有趣的是,这些有代表性的基因组也产生了相似的亚组:GSE14520非肿瘤样本中的9个亚型1的基因组也聚集在验证组中。GSE14520中2和3亚型的死亡比例没有大的差异,Kaplan-Meier plotter分析也显示2和3亚型的预后相对较差(图3E)。考虑到验证组的样本量较小,我们从样本中分离出亚型1(n=18),其他样本定义为亚型2/3。虽然通过生存分析,验证组中亚型1的HCC患者也倾向于长寿。
接下来,利用LASSO方法寻找HCC的预后基因组,最终发现了7个基因组(图6A和B)。在这些基因组中,有4个在非肿瘤组织中(N基因组),3个在肿瘤组织(T基因组) 。各基因组的高ESs与总体生存时间短相关(图6C)。
图6 HCC和非肿瘤组织的预后基因集03 - 功能和路径富集分析
为了弄清7个预后基因组在预后中的作用机制,作者提取了每个基因组所包含的基因,并在肿瘤和非肿瘤组织中进行了MF富集和Reactome通路分析。
对于非肿瘤样本,通过Reactome分析,N基因组的基因主要与MF的细胞粘附分子结合、细胞因子活性、免疫受体活性等术语相关,与白细胞介素的信号传导、血小板激活、信号传导和聚集、血管壁的细胞表面相互作用等术语相关(图7A)。
对于肿瘤样本,通过Reactome分析,T基因组的基因与腺苷三磷酸酶(ATPase)活性、小管蛋白结合、组蛋白激酶活性相关,并通过Reactome分析,与Mphase、细胞周期检查点、有丝分裂前分裂期和有丝分裂期的术语相关(图7B)。这些来自肿瘤组织的术语与细胞周期密切相关,这可能会促进肿瘤的发展。
图7 分子功能和反应组途径分析作者进一步确定了来自N和T基因组的枢纽基因,构建了一个蛋白质-蛋白质相互作用网络,结果导入Cytoscape中进行进一步的模块分析。通过MCODE(分子复合物检测)插件计算出前三个簇,并通过度值得到其在每个簇中的枢纽基因。
对于N基因集,簇1的前三位枢纽基因分别为CXCL8、CXCL9和CCR5,主要与免疫反应有关;簇2为ICAM1、ITGAM和IL1B,与细胞粘附密切相关;簇3为FBXO7、UBA6和SH3RF1,主要与泛素激活有关(图8A)。在T基因组方面,簇1中排名前三的枢纽基因为MELK、CCNB1和CDCA8,主要与细胞周期有关;簇2为PWP2、NLE1和KIAA0020(Pumilio RNA Binding Family Member 3,PUM3),与前核糖体和核糖体生物发生密切相关;簇3为EFTUD2、SRSF1和HNRNPM,主要与mRNA拼接有关(图8B)。
图8 N基因组和T基因组的蛋白质-蛋白质相互作用网络四、结论
综上所述,作者根据肿瘤和非肿瘤数据确定了3个临床相关的HCC亚型,maker包含非肿瘤组织中的4个预后基因组和肿瘤组织中的3个基因组。通过功能富集分析,4个正常基因组的基因与免疫反应和细胞粘附相关,可能通过促进肿瘤细胞的定植和存活而影响预后;而在肿瘤组织中,3个肿瘤基因组的基因与细胞周期密切相关,而细胞周期与肿瘤进展有密切的相关性。
网友评论