作为人类如今最大的健康威胁之一,癌症的治疗和预防已经成为重中之重。要想治疗癌症,就得认识癌症。
从一开始认为癌症是一个肿块再到发现癌症其实是由于基因突变导致的,期间经历了无数的波折,在这个过程中,我们的治疗方式也从手术、放化疗过渡到靶向药再到如今的免疫治疗,每一次的治疗革新都是建立在我们对于癌症的认知不断提升的基础上。
而随着对癌症认知的不断发展,我们越来越意识到基因和癌症之间的密切联系,不论是抑制癌症发生的抑癌基因,还是导致癌症发生的原癌基因,抑或是在生活和接触到化学物质或辐射导致的突变基因,都和癌症的发生密切相关。而搞清楚这些基因和癌症的关系,将极大的帮助我们了解癌症的发生发展情况,从而帮助我们更好地治疗癌症。
因此,我们才有了人类基因组计划,以及后来发展起来的Atlas癌症图谱体系,而随着测序技术地不断进步和测序成本地不断降低,我们得以以更低的成本了解到癌症的基因全貌。
而在今天,癌症的基因图谱再次登上了国际顶级期刊《科学》期刊的封面,为我们带来了最新的癌症基因图解。
这篇文章以“The chromatin accessibility landscape of primary human cancers”为名发表在最新一期的《科学》杂志上,同时也是这一期的封面杂志。下面就让我们一起来看看最新的癌症基因图谱。
癌症基因组图谱(TCGA)是一个全球联盟,他们会收集来自原发性人类癌症组织的DNA突变、甲基化、RNA表达和其他的综合数据来评估癌症的特征。
研究人员通过TCGA的410个肿瘤样本中生成了高质量的ATAC-seq数据,确定了23种癌症类型的不同监管环境,通过基因和癌症之前地相关性来预测基因、DNA调节元件和癌症发生的关系。与此同时,这些相互作用也会影响到癌症免疫治疗中的关键靶点,如MYC,SRC,BCL2和PD-L1。
通过这些信息,研究人员发现——原发性人类癌症的基因组提供了关于不同癌症类型的易感性、发生机制、预后和潜在治疗方法的大量信息。
这些信息都为我们未来预测DNA调节元件和基因启动子之间的相互作用,整合基因调控网络分析奠定了基础;数百种表现出等位基因特异性调节作用的非编码体细胞突变的发现表明癌细胞可以通过机制操纵基因表达从而使得癌症可以在体内不断生长和转移,而这些信息都将成为我们研究癌症的基础基因资源。
同时,这些大样本的数据也让研究人员发现了基因、DNA调节元件和癌症发生之间的关系。(在这里省去了大量的学术语言,如果有兴趣的话可以看图片下面的绿色小字)
研究人员通过样品中ATAC-seq可及性和基因表达相关性来检测ATAC-seq峰与调节基因的关系,因为启动子捕获Hi-C数据表明> 75%的基于三维(启动子的相互作用发生在500千碱基对(kbp)距离内,因此我们将该分析的长度范围限制为500 kbp以避免出现数据失误,使用的保守的FDR值为0.01,从而确定了远端ATAC-seq峰和基因之间的81,323个独特链接之间存在关系。这些链接中的一些是由许多癌症类型的相关性驱动的。正如预期的那样,峰与其目标基因之间的距离直方图随距离急剧衰减。大多数基因的表达与不同峰(少于5个)的活性相关,而预测大多数峰与单个基因相互作用有关。此外,该分析发现只有24%的预测链接发生在ATAC-seq峰和最近的基因之间,表明大多数预测的相互作用超过一个或多个基因,并且无法单独从一级序列预测。
结果发现:
有8552个蛋白质编码基因和癌症发病有关(这些蛋白质基因占据了人类基因组中近乎一半的蛋白质编码基因)。
除此之外,研究人员同样发现了非编码基因和癌症之间的关系。这都在文章中有详细的解释,本文文献开放,有兴趣者可以点击阅读原文查看完整文献。
随着精准医疗时代的到来,大数据和医疗之间的结合必将更加密切,伴随着癌症基因组的发展,我们已经深刻的认识到癌症是一个高度异质性的疾病。即使同为乳腺癌患者,体内的基因突变也可能存在很大的差异。因此,对于癌症的治疗需要更加精准地认知,而这些都需要有精准的癌症地图才能实现。
网友评论