美文网首页生不了啦
肿瘤基因组数据的解读-转载

肿瘤基因组数据的解读-转载

作者: 酷睿_1991 | 来源:发表于2018-10-11 15:06 被阅读35次

    首先,在进入正题之前,有必要介绍一下TCGA(The Cancer Genome Atlas)数据库的建立,和它带给肿瘤学研究的历史性变革(PS:用四个碱基的缩写来命名这个项目真是不能再妙了!)。直白的说, 进入21 世纪以来,个性化医疗的产生使人类对肿瘤的诊断和治疗早已不再停留在简单的表观阶段,人们渴望通过“上帝视角”来探索肿瘤产生和转移的根本基因学根源,而Next-generation sequencing 的发展使得高效的全基因组测序成为了可能。在这样的大背景下,NCI和 NHGRI 在2005 年发起了 TCGA project,在十多年的历程中,TCGA收录了美国和加拿大地区 11,000 多个病人样本,涵盖33 个肿瘤亚型,约 2.5 PB 的肿瘤样本高通量基因组测序结果。生物信息分析结合收录的病人诊断和治疗信息,肿瘤病理学信息,对肿瘤学的研究推进可以说是质的飞跃。在这之后,多个国家先后发起了类似的项目,于是在人类用智慧与肿瘤做斗争的同时,也随之产生了很多意外而有意思的发现。

    1. 伪装者:披着乳腺癌外表的”卵巢癌“

    之所以把它放在第一位,那是因为它可是TCGA 宣传手册上的官方事例,原文的描述是"surprising new

    findings"。这篇文章的出处是 2012 年TCGA 团队在 Nature 上发表的对乳腺癌亚型的综合分析。原文请戳Comprehensivemolecular portraits of human breast tumours.

    在个性化医疗发展之前,人们在给肿瘤下定义时,一般都会习惯性把一个器官或者组织上发生的肿瘤归为一类,无论亚型一不一致,诊断或者治疗都会在这个大背景下去展开。例如在乳腺癌中,有四种病理学亚型Luminal A, Luminal B, HER2+, Basal-like. 前两者一般都有高ER 和 PR 表达,于是Hormone therapy 再合适不过,HER2+ 肿瘤的治疗也随着单抗类药物Herceptin 的研发而逐渐明朗,但是basal-like(三阴性)乳腺癌确一直找不到一个明确的治疗方法,更多时候只是普通的化疗。简单地说,在这项研究中,科学家通过相关性分析,发现Basal-like 这一亚型的基因表达谱和其他三种亚型大相径庭,但是却和恶性卵巢癌和鳞状上皮肺癌组织的基因表达有着高度的相似性。

    [if !vml]

    [endif]

    这图来自原文的Figure5b,四列是 TCGA 对四种乳腺癌亚型的基因表达,七行是来自于另一个数据库GSE2109 中的七中不同部位肿瘤的基因表达,图中的颜色代表这一行和这一列肿瘤组织基因表达的相关性,黄色为高度相似,蓝色为高度差异。我们可以看到在Basal 这一列中,除了和乳腺癌样本中的 Basal 部分高度相似意外,还和恶性卵巢癌,以及肺癌中鳞状上皮亚型的那部分有着高度的基因表达相似性。但是和乳腺癌的其他亚型去比却是一片蓝。简而言之,这个在临床上死亡率颇高的亚型简直就是在披着乳腺癌的外表蛊惑人心,实则和卵巢癌以及肺癌高度相似!

    有什么意义?因为三阴性乳腺癌除了BRCA1/2 和 TP53 之外并没有什么令人惊喜的driver mutation, 但是由于 gene

    amplification 和信号通路的高度相似性,所以给人们的启发是可以考虑用治疗恶性卵巢癌的方法去尝试这一亚型。其实近几年类似的研究还有很多,例如食道癌和头颈部癌症也有高度相似性。

    这些发现的重要意义在于,人们今后对肿瘤的分类将会不再简单从组织和器官的亚型出发,而是直接用Gene siganture 去定义,并且至今从基因表达谱去关联肿瘤的治疗方案。

    2. 蝴蝶效应:一个碱基突变引起的全基因组重编程风暴

    想象一下,在你的体细胞的23 对染色体的基因组内,有着约三十亿个碱基对,而三十亿分之一的概率下,某一个细胞的某一个碱基发生了某一个点突变,瞬间引起了这个细胞整个基因表达谱中上万个基因表达程度发生剧变,而剧变的后果就是造成了这个突变细胞从此开挂,在肿瘤产生和转移的大路上势如破竹。

    这一系列惊为天人的连锁反应,其实对于生物信息学研究者来说并不意外,但是的确让人细思极恐。那么,一个碱基的突变是怎么产生这个蝴蝶效应的呢?

    举个我比较熟悉的例子吧,还是乳腺癌。2013年来,通过对临床肿瘤组织的基因组测序,人们发现在雌激素受体阳性的乳腺癌样本中,有30% 的病人样本在芳香化酶抑制剂治疗后会在雌激素受体第八个外显子的一个特定位点出现一个热点突变(对应雌激素受体蛋白序列上的AF2 domain)。最常见的就是 ESR1 基因DNA 上 1610 位的A 会突变为 C,而这个简单的单一碱基突变会继而引起雌激素受体蛋白序列发生错义突变,第537 位的酪氨酸会突变为丝氨酸(Y537S),而这样突变的后果就是在功能上造成了雌激素受体不依赖于雌激素的持续激活。由于雌激素受体是个著名的核内转录因子,整个基因组上有约100000 个雌激素受体转录结合元件,雌激素受体的转录调控对这些基因而言,有的是抑制转录,有的是增强转录,而这些基因又会去改变它们关系密切的其他基因,这样一传十,十传百,上万个基因表达量的改变可想而知。下面就放个heatmap 证明一下。

    [if !vml]

    [endif]

    图出自2016 年 10 月刚刚出炉的文章,Simak

    Ali 课题组用 Cripsr/cas9 构建了基因组层面编辑的雌激素受体基因ESR1 上 A1610C 的突变细胞模型(Y537S),和野生型的细胞一起做了RNA 测序。热图很直观,蓝色代表低表达,红色代表高表达,每一行都是一个基因。相信肉眼就能给人足够的冲击力,上万个基因表达的区别仅仅来自于一个碱基的突变!

    感慨一下,这就是肿瘤,一个拥有不可思议的微观超能力,并且不断夺走人类生命的撒旦。

    3. 隐藏的杀意:沉默突变在肿瘤中不再沉默

    先不多说,放一个截屏。

    [if !vml]

    [endif]

    这是一个可以让NCS 三大主流期刊同时发文的话题。沉默突变,顾名思义,就是碱基发生了突变,但是其编码的氨基酸并未改变。肿瘤研究的很长一段时间里,科学家的目光都放在了错义或者无义突变上。这本身看来非常有道理,那些经典的driver mutation 都是错义突变导致蛋白产物功能改变的结果。沉默突变嘛,一如既往的沉默在人们的视线中。

    但是,随着高通量测序的发展,人们开始意识到,这些沉默突变明明十分危险。一个基因上的沉默突变对肿瘤生长和转移的影响多种多样。这里简单举两个例子。

    第一个例子来自于2006 年一篇 Science 的文章。A

    "Silent" Polymorphism in the MDR1 Gene Changes Substrate Specificity。文章的最惊人之处在于点出了为什么沉默突变,也能造成两个氨基酸序列一模一样的蛋白拥有功能变化。文章关注于著名的编码外排泵蛋白p-gp 的耐药基因 MDR1 上点C3435T 沉默突变,他们发现这个突变的虽然没有改变蛋白上的氨基酸序列,但是由于蛋白翻译系统对这个密码子的识别速度较慢,导致了整个蛋白的翻译过程变慢,从而在内质网和高尔基体中发生折叠时的构想发生了轻微变化,最终导致了p-gp 蛋白的外排作用更强,从而使得肿瘤细胞更加耐药。

    第二个例子来自于2005 年的一篇 PNAS,(http://www.pnas.org/content/102/18/6368.short).一个意大利课题组关注了囊胞性纤维综合症的关键调控基因CFTR 位于第 12 外显子边缘的一个沉默突变。他们发现这个沉默突变引起蛋白改变的关键步骤在于成熟mRNA 的切割,由于负责 RNA 切割的内切酶无法识别这个突变后的转录产物,所以直接导致了第12 外显子的所有编码序列被全部切除,继而蛋白也发生了失活,失去了调控元件以后一切都有利于囊胞性纤维综合症的恶化方向发展,肿瘤也就不期而至。

    其实还有很多其他研究发现了不同的机制,例如沉默突变的引入直接改变了DNA 的甲基化,在表观遗传层面就发生了区别。

    我们都知道肿瘤的产生离不开突变,可是面对无处不在的突变,真正的杀手实在扑朔迷离。

    以上几个比较有意思的例子,都是我在平时的研究中所碰到的,也算在此抛砖引玉。

    最后,引用一句话吧。来自肿瘤基因组研究领域世界公认的领袖级科学家,英国桑格研究院(Wellome

    Trust Sanger Institute)主任 Sir

    Michael Stratton (在英国当一个科学家被冠以“Sir”的头衔,已然超然世外),我有幸在2016 年的波特兰国际乳腺癌研究大会上听过他的报告,并和他有过交流,他当时的一句话十分有震撼力,大概的意思是:“在人基因组中只有2% 的部分编码蛋白,但是肿瘤的突变却涵盖了整个基因组,有错义的,有无义的,也有沉默的。对肿瘤的斗争需要人们突破传统的生物学观念,用更加长远而广阔的视野去分析和看待基因组和突变。肿瘤不可怕,可怕的是停滞不前的目光。”

    相关文章

      网友评论

        本文标题:肿瘤基因组数据的解读-转载

        本文链接:https://www.haomeiwen.com/subject/dyseoftx.html