Genomic Predictors of Good Outcome, Recurrence, or Progression in High-Grade T1 Non-Muscle-Invasive Bladder Cancer
高等级T1非肌层浸润性膀胱癌的良好结果、复发或进展的基因组预测因素
发表期刊:Cancer Res
发表日期:2020 Oct 15
影响因子:13.312
DOI: 10.1158/0008-5472.CAN-20-0977
一、研究背景
膀胱癌是癌症发病率和死亡率的一个主要来源。初次诊断时,约75%的患者为非肌层浸润性膀胱癌(NMIBC),要么局限于粘膜[Ta和原位癌(CIS)],要么侵犯膀胱固有层但不侵犯固有肌层(T1)。高等级T1(HGT1)膀胱癌占所有NMIBC的25%至43%,与其他形式的NMIBC相比,其复发和发展为浸润性疾病的风险更高。
HGT1肿瘤可以表现为类似的组织病理学特征,但临床表现却非常不同。因此,治疗建议包括保守性卡介苗(BCG)膀胱灌注、重复的经尿道膀胱切除,再到立即进行根治性膀胱切除。不幸的是,为更广泛的NMIBC人群设计的预后模型和算法还没有在HGT1中得到验证。
1、数据来源
1) 128个福尔马林固定的石蜡包埋(FFPE)肿瘤样本进行核酸提取;77份临床注释的HGT1尿路上皮癌样本,77个肿瘤样本中有62个符合该标准,通过WES从62个样本中获得了高质量的数据。
2)27个匹配的组织-正常(T/N)WES的样本
3)外部验证:63个HGT1分析样本,将GO定义为没有复发或进展(GO=36;R/PD=27);cBioPortal分析了来自38个HGT1样本,将GO定义为没有复发(GO=19;R=15);78个HGT1样本的RNASeq数据进行突变调用
2、分析流程
1) 核酸分离、DNA测序和数据处理、SNVs和Indels的调用、胚胎事件过滤、突变的意义分析、拷贝数分析
2) 仅肿瘤(TO)分析:根据TCGA确定的显著突变基因(SMG)和根据参与其他尿路上皮癌亚型选择的额外基因,在TO队列样本中选择95个基因进行详细的突变分析
3) 突变特征分析:使用SignatureAnalyzer对62个样本的27,477个SNVs进行了全新的突变特征分析,将其分为96个碱基替换类型;该算法应用了非负矩阵分解(NMF)算法的贝叶斯变体,并采用指数先验,以实现新特征的发现;62个样本的MSig聚类分析是用R语言中的标准层次聚类法进行的
4) MutCN:SMG和病灶SCNAs中突变的无监督聚类
5) 肿瘤/正常对分析、TO和T/N调用的比较、匹配队列中的突变分析:对15个肿瘤-正常对的突变与相应的配对突变(PAIRED)进行了比较;表明在PAIRED的体细胞突变调用中,邻近正常的肿瘤成分污染是一个重要的混杂因素
01 - 人口统计、临床和病理学数据
获得了77份临床注释的HGT1尿路上皮癌样本。该研究队列于2005年4月开始,最后一次评估于2014年2月进行,中位随访时间为7.4年(范围,2-9年)。所有患者在初步诊断后均接受卡介苗治疗。随访包括每3个月进行一次细胞学检查,并在前2年和之后每6个月交替进行膀胱镜检查或影像学检查(12)。临床结局分类为GO(未见复发或进展)、复发性疾病(R)(当复发性疾病相同或低于同一阶段)或进行性疾病(PD)(在随访至少4年后看到肌肉侵袭或转移)时进展为进展性疾病(PD)。在最后一次评估中,这组患者的结局GO为33例,R为10例,PD为18例,临床状态未知的1例。通过WES从62个样本中获得了高质量的数据,进一步的分析仅限于这些样本。
02 - 肿瘤突变分析
由于大多数患者样本缺乏对照组织或血液DNA样本,因此只进行了肿瘤突变调用。在使用COSMIC和ExAC数据库对种系变异进行严格过滤后,确定了20,661个影响编码序列的SNVs(错义、无义、剪接位点)和6,816个沉默或非同义突变。在62个TO样本中,包括非沉默和沉默变异的突变率中位数为每Mb 8.6(每个样本中位数为303个SNVs)。15个样本有匹配的正常组织,可以进行肿瘤-正常样本的配对分析,该分析确定了5,956个SNVs,每个样本的中位数为284个突变,与TO组的中位数相似。为了测试TO分析的性能,忽略了15个TN病例中匹配的正常样本,并比较了所产生的突变。所有非沉默变异的总体灵敏度和精确度分别为80%和73%。
这62个样本的非沉默性突变率的中位数是每Mb 6.5个突变,略高于TCGA分析中MIBC的平均数和中位数分别为每Mb 7.7和5.5。以前对Dana Farber癌症研究所(DFCI)的一个不同的膀胱癌患者样本集的分析也显示,高等级NMIBC的肿瘤突变负担(TMB)相对较高,与MIBC类似,但也有缺乏正常对照的限制。GO、PD和R患者的总体TMB有显著差异,中位突变率分别为9.6/Mb、7.3/Mb和5.7/Mb(图1A)。
图1在这组样本中,有17个基因被确定为突变率显著(SMGs),通过MutSig2CV在超过10%的样本中发现突变(图2)。TP53突变出现在40%的样本中(62个中的25个),并且很少与MDM2扩增重叠(10个中的2个)。值得注意的是,TP53通路的改变(TP53突变或MDM2扩增)在有FGFR3突变或扩增或TSC1突变或缺失的样本中未见。
图2 62个HGT1膀胱癌样本中的突变和拷贝数改变情况染色质基因的改变在队列中是最常见的。17个SMG中有7个是染色质修饰或调节基因:组蛋白去甲基化酶(KDM6A 24%),组蛋白甲基转移酶(KMT2C 21%,KMT2D 27%),组蛋白乙酰化酶(CREBBP 21%,EP300 16%),SWI/SNF染色质重塑复合物的一个成员(ARID1A 11%),以及多瘤组基因(ASXL2 13%)。这些基因都是已知的在MIBC中反复出现和明显突变的基因。此外,9%的肿瘤显示CREBBP的缺失。
细胞周期相关基因是第二大最经常改变的基因组,包括。CDKN2A缺失(31%),RB1突变(18%),和TP53突变(40%)。DNA损伤反应(DDR)基因的突变频率也很高(ERCC2 16%,BRCA2 11%,STAG2 13%,和ATM 10%)。最后,RAS/RTK/PI3K信号通路的几个基因被发现经常发生突变(FGFR3 13%,PIK3CA 13%,ERBB2 15%,ERBB3 16%,和RHOB 15%)。
03 - HGT1的基因突变和临床结果之间的关系
作者考虑了本队列中确定的17个SMG,TCGA MIBC分析中确定的54个SMG,以及文献中确定的对NMIBC重要的42个基因,总共95个基因。不同样本的异质性突变负担是确定突变基因与临床结果或其他协变量关联的一个重要混杂因素。为了减轻这种情况,使用了一种基于排列组合的方法,保持每个样本和基因的非沉默突变的总体数量,以确定重大关联。只考虑了在≥4个样本中看到的30个基因的突变(排除了由于POLE突变导致的单一高突变表型样本),并通过FDR调整经验P值(图1B)。
ERCC2是唯一一个突变与GO密切相关的基因。BRCA2突变在GO子集中也有适度的富集。相比之下,TP53突变在PD亚组中略有富集(图1C)。其他几个基因与不同的临床结果显示出适度的关联(图1B),但在校正多重假设检验后,没有一个是显著的,包括PD中的ATM、ARID1A、AHR和SMARCB1;以及R子集中的RHOB和ARID1A。
当应用同样的随机互换方法进行基因突变与总体突变负担的关联时,ERCC2突变与TMB明显相关,这表明GO(与PD/R)中较高的突变负担部分是由于ERCC2突变的富集。ERBB3、KMT2C和TP53突变也在高突变负担的样本中富集,但在校正了多重假设检验后并不显著。
04 - DDR基因的改变
在高等级的NMIBC肿瘤(但不是低等级的)中已经描述了DDR基因的改变,其比率与MIBC相似,并与较高的突变负担有关。为了更好地了解DNA损伤和修复过程在HGT1中的作用,作者评估了包含主要DNA修复途径的34个基因。发现60%的样本(62个中的36个)至少有一个非沉默的DDR基因突变(补充图S2),与R和PD相比,GO组更为频繁。DDR基因突变的存在也与较高的突变负担有关。ERCC2错义突变是最常见的DDR基因改变,发生在16%(62例中的10例)的病例中。11%的BRCA2、13%的STAG2和10%的ATM也发生了突变。事实上,当从分析中去除ERCC2突变时,DDR突变不再与GO相关,这表明ERCC2的突变是这种关联的驱动因素。与高TMB与GO的关联一致,ERCC2突变的肿瘤的突变负担明显高于ERCC2野生型(图1A)。当关注核苷酸切除修复基因整体(包括ERCC2)时,发现该组的突变(校正突变负担后)是GO的预测因素。
补充图S2 DDR突变与结果的关系05 - 突变特征分析
非负矩阵分解(NMF)被用来对62个样本的27,477个SNVs分层为96个碱基替换类型进行新的突变特征分析,并确定了五个突变特征(图3A)。确定了两个不同的APOBEC特征,APOBEC-A和APOBEC-B(对应COSMIC2和COSMIC13;在COSMIC突变特征V3中被称为SBS 2和SBS13),分别占所有突变的30%和16%。APOBEC介导的诱变(COSMIC2和13)是该肿瘤样本集的主要突变来源,总体活性为46%,在去除单个样本中看到的POLE突变后上升到55%,与TCGA MIBC队列中的突变相似。
具有TMB 109 SNVs/Mb的单一高突变样本有95%以上的突变可归因于POLE特征,并且在同一读数中除了N423K之外还存在POLE热点二核苷酸突变L424V。还发现有两个样本的C>T在CpG突变中占主导地位,即vh122(≥80%)和vh73(≥60%),而其余样本中该特征的活性不足20%(补充图S4A)。这两个样本的突变谱与COSMIC1和COSMIC6显示出较高的余弦相似性。由于COSMIC6已知与DNA错配修复缺陷有关,并常见于微卫星不稳定的肿瘤,作者在这些样本中搜索错配修复基因的突变。事实上,vh122的MSH2有一个剪接位点突变,被注释为可能致病,而vh73的MLH1有一个剪接位点突变。
补充图S4 突变特征和MSig群组正如以前在MIBC中所证明的,COSMIC5特征的活性在队列的ERCC2突变样本中明显较高。在校正突变负担后,KMT2C突变也与COSMIC5特征明显相关。此外,ERCC2突变与SNV的总体数量有关,表明GO患者突变负担的增加,除了APOBEC诱变外,部分归因于COSMIC5的活性。值得注意的是,以TCW(W=A/T)处的C>T突变为主的COSMIC2的活性在GO样本中要高得多(图3B),尽管APOBEC诱变的总体活性(COSMIC2+COSMIC13)没有达到统计意义。GO样本的整体APOBEC和COSMIC5活性稍高(图3B),但这并不具有统计学意义。C>T_ CpG特征在R中较高,但整个样本的总体贡献较小。所有的特征富集分析都是在没有POLE突变的样本的情况下进行的。
图3此外,根据五个突变特征的活性进行了无监督聚类分析,并确定了五个突变特征聚类,即MSig1-5。每个集群都与疾病结果的特定趋势相关,MSig4也与pT1b微分期相关(补充图S4B和S5)。
补充图S5 突变特征集群(MSig)06 - 体细胞拷贝数的改变
采用GISTIC分析以辅助人工检查,确定了多个基因的病灶扩增,PVRL4扩增在复发性肿瘤中有些富集(图2)。其他几个拷贝数(CN)的变化与结果有轻微的关联:6p22.3的扩增,包括SOX4和E2F3,在进展者中更频繁;PPARG的扩增在GO中更频繁;CDKN2A缺失和CCNE1扩增都在PD或R肿瘤中更为频繁;三个RB1缺失仅见于GO。染色体臂级的体细胞拷贝数改变(SCNA)涉及几个含有已知在膀胱癌中改变的基因的染色体臂,包括9号染色体缺失、20号染色体扩增、8p扩增和10q缺失。在臂级SCNAs中没有观察到特别的模式或富集的结果(补充图S6,右热图)。
补充图S6 体细胞复制数的改变病灶SCNA的无监督层次聚类确定了三个主要聚类(补充图S5,左热图)。聚类一的特点是9号染色体的一致丢失,类似于Ta中看到的基因组亚型2(GS2)。聚类二的特点是CN事件频率高,有富集PD患者的趋势。聚类三是CN安静,没有或有少量的CNA,类似于Ta的GS1。
07 - 突变和CN聚类
TCGA 2014研究通过无监督的NMF聚类,根据SMGs和病灶SCNAs的突变,在125个MIBC样本中确定了三个生物学上的不同群体。(i) "病灶扩增 "组,几个基因的病灶SCNA富集,以及KMT2D的突变;(ii) "CDKN2A缺陷/FGFR3改变 "组;(iii) "TP53/细胞周期改变 "组,几乎所有样本都有TP53突变,以及频繁的RB1突变和E2F3和CCNE1的扩增。基于基因表达的类似分析也在NMIBC和MIBC的混合队列中发现了两个主要的基因组回路:一个回路的特点是FGFR3改变、CCND1过表达、9q和CDKN2A缺失,另一个是由E2F3扩增、RB1缺失和5p增益定义。作者对46个基因改变进行了基于NMF的共识聚类,包括23个基因的突变,13个基因的局灶性扩增和缺失,以及10个复发性臂级增益或缺失。根据突变(Mut)和CN事件一致确定了三个集群,称之为MutCN1-3(图3C)。
MutCN1(n = 19)的特点是TP53突变和CCNE1、PVRL4、YWHAZ、E2F3-SOX4和PPARG的局灶性SCNAs增益,主要对应于MIBC的"TP53/细胞周期改变 "组。MutCN2(n = 22)与RB1和ERCC2以及几个染色质修饰基因、CREBBP、KMT2D、KMT2C和EP300的突变有关。MutCN3(n = 20)与FGFR3的突变和扩增、CDKN2A的缺失和CCND1和MDM2的扩增以及9、17和20号染色体的丢失有关,这类似于MIBC中的 "CDKN2A缺陷的FGFR3突变"组。
MutCN聚类与临床结果有关(图3D)。MutCN1与进展或复发的比例要高得多,与GO相比,总患病率为12/19(63%)例。MutCN2的临床结果基本良好,相对于PD,GO的比例最高;MutCN3处于中间位置,由PD、R和GO的平均混合组成。MutCN集群也与pT1a与pT1b之间的微观分期明显相关(图3E),这也与最初的临床队列结果有关。容易进展的MutCN1藏有最高比例的pT1b,而MutCN2的pT1b较少,MutCN3的pT1b的比例居中。
08 - 突变特征聚类分析
作者根据五个突变特征的活性进行了无监督聚类分析,确定了五个突变特征聚类,即MSig1-5(补充图6,补充图4b)。MSig1形成了最大的集群(补充图6),并且具有最低的TMB中位数,还具有最低的APOBEC诱变活性和最高的COSMIC1比例。两个假定的MSI样本由于在CpG上的C>T突变与COSMIC6相似而属于这个集群。这个MSig1与疾病复发有关。MSig2形成第二大集群(补充图6,蓝色,n=18),具有适度的TMB和中等的APOBEC活性,每个样本中位数为234个突变。与MSig1相比,该群组呈现出与良好结果相关的趋势。MSig3(n=7)具有最高水平的COSMIC5活性,即ERCC2相关的突变特征,事实上,7个肿瘤中有5个具有ERCC2突变。有趣的是,这个集群中的7个样本都有GO。MSig4(n=6)的TMB最高,主要是由于APOBEC突变活动,除了POLE突变样本外。有趣的是,这个集群中的所有样本都有TP53突变,考虑到这些突变的核苷酸变化和背景,与其他MSig集群中的TP53突变相比,这些突变与两个APOBEC特征相关的可能性明显更高,表明APOBEC的诱变活性可能是造成这些TP53突变的原因。在这个集群中,6个样本中有3个有进展性疾病(PD),6个样本中有5个有pT1b疾病。正如预期的那样,具有高POLE突变的样本形成了自己的集群(MSig5)。
总之,高突变负担、ERCC2突变和高APOBEC-A/ERCC2(COSMIC2和COSMIC5)突变特征是HGT1的GO的重要预测因素。TP53突变和CCNE1的CN增益结合CDKN2A缺失与疾病进展有关。在等待独立验证的同时,作者发现建议考虑对HGT1膀胱癌进行突变分析,以评估这些突变和CN特征,从而改善对GO或复发或进展风险的预测。
网友评论