Analysis of Omics Data Reveals Nucleotide Excision Repair-Related Genes Signature in Highly-Grade Serous Ovarian Cancer to Predict Prognosis
组学数据分析显示高级浆液性卵巢癌的核苷酸切除修复相关基因特征可预测预后
发表期刊:Front Cell Dev Biol
发表日期:2022 Jun 13
DOI: 10.3389/fcell.2022.874588

一、背景
在所有的卵巢癌中,高级别浆液性卵巢癌(HGSOC)它占了卵巢癌死亡人数的70%-80%。其致癌模式、分子遗传特征和起源都与低级别浆液性卵巢癌不同。由于缺乏有效的卵巢癌早期筛查方法,几乎90%的浆液性卵巢癌患者在初诊时被诊断为III-IV期,而HGSOC晚期患者的10年生存率仅为15%。
DNA损伤反应和修复途径在卵巢癌的发生和发展中起着至关重要的调节作用,DNA修复机制主要包含各种途径,如错配修复、碱基切除修复、核苷酸切除修复(NER)、同源重组和非同源末端连接。重要的是,HGSOC大多伴随着与NER途径密切相关的P53突变。
近年来,大量研究报道了NER相关基因,如ERCC1,XPC和GTF2H5,可用作肿瘤患者治疗反应或预后的生物标志物。然而,尽管NER在卵巢癌领域的关注度增加,但仍缺乏对HGSOC晚期患者NER相关基因的全面分析,以评估预后并有效指导治疗策略。
二、材料与方法
1.数据来源
1) 从TCGA获取378个卵巢癌组织,从GTEx获取88个正常卵巢组织的RNA-seq数据的每千碱基转录片段(FPKM);最终有326个晚期HGSOC样本的RNA-seq数据和临床数据被纳入分析中。
2)4套GEO数据:GSE13876(N = 415)、GSE49997(N = 204)、GSE17260(N = 110)、GSE63885(N = 101);将三个数据集[GSE49997(N = 166)、GSE17260(N = 110)和GSE63885(N = 70)]的346个符合标准的样本整合为一个联合验证集
3)根据以前的研究,TCGA-GTEx和4套GEO 数据集中与核苷酸切除修复 (NER) 相关的31个共同基因。
2.实验流程

三、实验结果
01、31个NER相关基因的表达情况
为了更好地了解NER相关基因在肿瘤发生和发展中的重要性,作者首先研究了合并的TCGA-GTEx数据集中不同组织样本中的NER相关基因的表达水平。TCGA-GTEx队列包括326名晚期HGSOC患者和88名健康捐赠者的卵巢。在所有数据集的8466个共同基因中选择了31个NER相关的候选基因进行进一步分析(图1A)。然后,这31个基因的mRNA表达水平通过热图展示给HGSOC和相应的正常对照组(图1B)。总的来说,与正常对照组相比,HGSOC组织中13个NER相关基因的表达水平明显增加,15个基因明显下调(图1C),3个基因(包括POLR2B、ERCC4和POLR2A)的表达水平没有显著差异。

31个NER相关基因之间的相互作用关系由PPI网络显示,图2中统计了每个基因的相互作用数量。31个基因之间的相互关系具有高度的紧密性和高度的复杂性(图2A)。除CUL3和CUL5外,其他29个基因似乎是相互作用网络的枢纽基因,因为它们与一半以上的基因有相互作用(图2B)。作者还进行了相关性分析,观察到HGSOC中的一些NER相关基因之间存在不同程度的正负共线性关系(图2C)。31个NER相关基因的相关性变化可能反映了相应转录功能蛋白之间的拮抗或协同作用的内在特点。

02、NER相关基因的共识聚类确定了具有不同预后结果的两个HGSOC亚型
接下来,选择TCGA HGSOC样本进行后续的共识聚类分析。根据31个NER相关基因的表达相似性,当聚类稳定性数据集从k=2-9增加时,k=2可能是最佳选择(图3A-C),每组的样本数分布大致平衡,当k = 2时,两组之间的干扰最小(图3C)。因此,通过共识聚类分析,TCGA HGSOC样本被分为两组(184个样本在第一组,142个样本在第二组)。此外,主成分分析(PCA)被用来比较两个亚型之间转录谱的差异,结果显示出明显的区别(图3D)。此外,发现亚型1中的晚期HGSOC患者的OS明显低于亚型2中的患者,这表明31个NER相关基因可以在预后层面上对晚期HGSOC患者进行分类(图3E)。然后分析了亚型与临床病理特征之间的关联。然而,在年龄、等级、分期、治疗反应和残余肿瘤方面,两个亚型之间没有发现明显的差异。

03、基于NER相关基因的预后价值和风险特征的鉴定
为了进一步探讨31个NER相关基因的预后价值,作者根据TCGA中基因的mRNA表达水平进行了单变量Cox回归分析。结果显示,13个NER相关基因中的7个与OS有潜在关联。在这七个基因中,只有DDB2和POLR2D被认为是HR<1的保护性基因,而RPA2、CCNH、XPC、ERCC2和ERCC4被认为是HR>1的风险基因(图4A)。
这些基因之间的共线性关系可能会影响传统Cox回归分析的准确性(图2C)。因此,作者对这七个可能与预后有关的基因进行了LASSO Cox回归方法,最终确定了预后最强的NER相关基因。LASSO结果表明,所有七个基因都被选为构建预后风险特征(图4B,C),所选基因的系数显示在图4D。然后,根据系数计算风险分数,以风险分数中位数为临界值,326名HGSOC患者被平均分为高风险组和低风险组。图4E-G显示了基于7个基因特征的风险评分、OS状态和mRNA表达谱的分布情况。K-M生存图显示,高风险组晚期HGSOC患者的OS明显比低风险组差(图4H)。高危组的5年OS为14.1%,低危组为27.0%。风险特征的预测能力显示出良好的预测效率,AUC值等于0.693(图4I)。接下来,本研究还调查了风险组与临床病理特征之间的关联(图4J)。结果显示,除了治疗反应,高风险组和低风险组在年龄、等级、分期和残余肿瘤方面没有明显差异。

此外,人类蛋白质图谱(HPA)数据库被用来验证7个选定基因在浆液性卵巢癌组织和正常卵巢组织中的细胞亚定位和表达模式(图5A-G)。HPA分析显示,在蛋白水平上,DDB2、POLR2D、CCNH和RPA2在HGSOC组织和正常对照组中的表达与mRNA水平变化相似,主要位于细胞核中。然而,XPC和ERCC2在浆液性卵巢组织和正常卵巢组织的蛋白水平上没有显示出明显的区别(图5C,E)。HPA数据和TCGA RNA-seq数据之间的异质性可能是由于转录后调控的差异。总的来说,这些结果进一步验证了NER相关基因的调控在浆液性卵巢癌中是高度紊乱的。

04、验证风险特征以预测HGSOC晚期患者的OS
为了证实基于分类器的NER相关基因在不同队列中具有相似的预后价值,作者分别评估了GSE13876(n = 415)和合并的GEO数据集(n = 346)中的样本。根据TCGA HGSOC队列的中位风险评分作为分界值,在GSE13876中,192名患者被归类为低风险,223名为高风险;在合并的GEO数据集中,255名患者被归类为低风险,91名为高风险。在GSE13876中,高危组相应的5年OS为24.1%,低危组为35.0%(图5H)。同样,在合并的GEO验证集中,高风险组的5年OS为35.3%,低风险组为67.8%(图5I)。两个验证集的风险评分、OS状态和mRNA表达谱的分布如图5J,K。如图6A-F所示,对于FIGO IIIC期的患者、CR/PR的患者、最佳细胞还原手术的患者或非最佳细胞还原手术的患者,高风险组与低风险组相比OS率更差。然而,由于样本量的限制,FIGO IV期患者或SD/PD患者的高风险组和低风险组之间的OS没有明显差异。

05、Nomogram结合NER相关的风险特征和临床相关的特征来预测患者的OS
为了研究由mRNA表达构建的风险特征是否比其他临床相关特征的预测效果更好,如年龄、阶段、等级、治疗反应和残余肿瘤等各种变量被列为潜在的预后因素。在TCGA HGSOC队列中,单变量和多变量分析的结果显示,治疗反应和风险特征与OS明显相关(图7A,B)。由于年龄对OS的潜在影响,开发了一个结合年龄、治疗反应和风险特征的nomogram来预测HGSOC晚期患者的3年或5年生存率(图7C)。nomogram的校准图显示了原始队列中nomogram预测和3年或5年OS的实际观察之间的可接受性和一致性(图7D)。NER相关的风险特征可以为这些晚期HGSOC患者的预后提供最有用和准确的信息。

06、高危组和低危组的基因集富集分析
为了更好地理解基于风险特征的NER相关基因的意义,作者进行了GSEA分析研究了TCGA队列中高危组和低危组的信号通路。耐人寻味的是,参与以下生物过程/信号通路的基因在高危组中表现出活跃的表达:mTOR信号通路,磷酸肌醇代谢,磷脂酰肌醇信号系统,MAPK信号通路,和VEGF信号通路。相反,在高危组中观察到两个下调的生物过程/信号通路。DNA复制和剪接体(补充图S2)。上述结果表明,基于7个NER相关基因确定的风险特征与HGSOC的恶性程度密切相关。

四、结论
作者分析了HGSOC和正常样本之间显著差异的NER相关基因,这些基因可能在HGSOC的进展中发挥重要作用。作者构建了一个强大的风险特征,与HGSOC的临床结果显著相关,并在两个不同的GEO验证集中得到验证。此外,还开发了一个包含风险特征和临床相关风险因素的7个基因nomogram,这可能有助于对晚期HGSOC患者的预后进行个体化预测。最后,对这些基因的进一步研究可能会对NER修复途径和HGSOC预后之间的潜在关系提供新的见解。
网友评论