原文链接:
Comprehensive Characterization of Cancer Driver Genes and Mutations
研究亮点总结
- 将PanSoftware软件(26种软件)应用到PanCancer(泛癌症)数据分析中,发现了299个癌症驱动基因(由于研究者只关注于点突变(point mutations)和短的插入缺失(small indels),所以驱动基因有限);
- 不同解剖学组织起源和细胞类型的癌症中,驱动基因和变异是共享(即不同的癌种中有相同的驱动基因和驱动变异)的;
- 体外研究联合实验验证发现了约3400个驱动变异;
- 57%的肿瘤含有潜在可靶向的驱动事件(potentially actionable oncogenic events);
- 33种共计超过9000(9423)个肿瘤样本的数据分析显示了TCGA肿瘤样本中,临床可操作的癌症驱动事件的存在是普遍的;
图片摘要
图片摘要讨论与总结
- 变异只考虑了点突变和短的插入缺失,没有考虑拷贝数变异(copy-number variations)、基因组融合(genomic fusions)和甲基化事件(methylation events),但是尽管如此,该研究依然代表着迄今为止最为综合的、发现癌症驱动基因的努力,并且将会作为非常重要的研究资产(research asset);
- 当前还有许多重要的问题没有解决:1)不同癌种的驱动基因集具有相似性;2)变异的顺序与时间(比如哪些是促使癌症发生的变异(founder mutations),哪些是促进进展的变异(progression mutations),等等);3)不同变异间的相互作用;4)不同变异对同一个基因的影响;5)准确地将驱动变异与“乘客”变异进行区分;6)变异特征(mutational signatures)与驱动基因之间的关联;7)突变负荷与新抗原负荷之间的区别;8)对治疗的意义(the implications for therapeutics),等等。使用该研究中得出的一致的驱动基因和功能突变,能够给出部分答案(provided partial answers);
- 不是所有存在于驱动基因中的变异都是驱动变异,因此发现真正的驱动变异亚集依然是一个重大的挑战;
- 研究结果显示,癌症特异的基于序列的方法在检测致病突变的目的上表现突出;
- 在预测驱动变异上,基于结构的方法比基于序列的方法特异性更好,但是灵敏度更低了,所以同时使用两种方法可以提高预测的灵敏度(improve prediction sensitivity);
- 在10,000个TCGA样本中,研究人员预测有大约一半的肿瘤带有临床相关的变异(clinicially relevant mutation),无论是对特定治疗方案敏感或耐药,还是可以作为临床试验的准入标准;
- 本研究以及其他大型TCGA研究的结果代表了迈向癌症研究以及最终癌症治疗新时代的早期步骤,相应的研究还要继续朝前迈进,不能只关注于单个的基因(individual genes),而要系统地整合癌症基因组的多方面因素,包括体细胞与生殖细胞变异的相互关系、肿瘤微环境以及免疫系统等;
- 原文最后一句欣赏:
Although this study represents the largest cancer gene and mutation study to date, we are mindful that the corpus of cancer driver genes and mutations may still be incomplete. However, it is likely that the community is nearing the beginning of the end of this phase of research, as larger cohorts continue to be examined with longer-range and longerread sequencing technologies.
(非常丰富的生物信息分析文章,后续还需要精读)
研究方法与结果
A. 变异数据集与驱动基因识别能力
- 首先,通过Ellrott等2018年在Cell Systems上发表的MC3方法(详见明天的文献阅读笔记)来进行变异检测,
网友评论