本期,我们一起来分析一下2018年发表在Cancer Research(2019年该杂志最新影响因子为8.378)上的一篇由瑞典皇家理工学院发表的关于皮肤恶性黑色素瘤的文章。
文章题目:Spatially Resolved Transcriptomics Enables Dissection of Genetic Heterogeneity in Stage III Cutaneous Malignant Melanoma
空间分辨转录组学有助于分析Ⅲ期皮肤恶性黑色素瘤的遗传异质性
首先我们简单说一下背景,皮肤恶性黑色素瘤存在广泛的瘤内和瘤间异质性,是所有癌症中突变负荷最高的癌症之一。同时也是一种高免疫原性的癌症,能够诱导原位癌和转移癌中的与免疫细胞浸润相关的免疫反应。
材料选择为III期皮肤恶性黑色素瘤淋巴结转移瘤的活检样本。并且记录了不同存活时间,共四个病人样本,其中一个是长存活期的病人样本(>60个月),每个样本两份组织切片样本。这些病人组织样本切片都通过了H&E染色和有经验的病理学家对组织区域进行划定,圈出肿瘤区域、基质和淋巴组织区域。然后利用空间转录组测序芯片进行后续处理,由于前几期我们已经介绍过了原理,这里不再赘述。我们主要看下他做了哪些工作和思路是什么。
Table 1. Clinical dataa Figure 1.Spatial transcriptomics overview.最终一共分析了2200多个spot的数据,并且每个样本的数据都测到近饱和的程度,平均每个spot 300个转录本。首先它将八个样本的每个样本转录组数据进行人为的混合,形成bulk转录组数据,然后对这八个样本进行PCA分析,可以看到同一个病人肿瘤组织间的变异程度不大,每个病人的样本聚到一起,并和其他病人样本明显分开。利用分层聚类的方法对50个基因的表达进行分析,进一步证明了这个结果。
Figure 2.Analysis of in silico bulk data. Data from all spots (tissue domains) within a section was merged to mimic bulk RNA-seq data.进一步对这2200多个spot数据进行特定基因的分析和t-sne的分析,可以看到,肿瘤组织间具有非常大的基因表达的变异。这里结合起来看图A和图B,图中两种不同形状的切片来自两个不同的病人。上面活检样本1,病理学家圈出来的黑色素瘤区域和B中上面基因表达数据是能够明显对应上的,并且B中基因表达区域的边界非常清晰。我们再看图中下面的活检样本2,尽管病理学家圈出来的边界是比较清晰的,但是我们看B中下面对应基因表达的数据,却呈现出明显变化程度很高的表达模式,说明肿瘤异质性很高。从病人存活期看,活检样本1的病人是存活周期长的病人,而活检样本2则是存活期的病人。我们再来看肿瘤因子的活性情况,C图中Melanoma-A和-B分别用来标识不同的激活因子表达情况,其中-A标识CD63和 PMEL,-B标识S100B和FTH1。最右边是淋巴组织区域。-A与病理学家注释的区域是对应的,-B和-A在这两个因子表达上则是有重叠的。淋巴组织是对应的。D是-A和-B中分别表达前五位的基因,可以看到是存在明显差别的。E图是淋巴组织和肿瘤组织切片放大图的比较,同样能看出两个样本的显著差别。
Figure 3.Tumor morphology and results from factor analysis.接下来该文章对肿瘤微环境的基因表达情况进行了分析。活检组织1中的淋巴组织在空间上距离肿瘤组织较近,但是还保持的明显的距离,比较适合分析肿瘤微环境的互作,因此被选为后续分析样本。首先鉴定了一些高表达的基因 FTL, B2M, APOE, 和 HLA相关基因 (HLA A-C)。然后对该样本的280多个spot数据进行PCA分析,聚类得到4个clusters,这4个clusters与病理学家注释的区域完全对应,看图A和图B。这些基因表达的情况会受到淋巴组织与肿瘤细胞距离的影响。然后看E图是标注了对分群有显著作用的基因,其中PMEL主要在肿瘤组织中表达。SPP1表达覆盖的区域更大,不只是肿瘤组织,还包括与肿瘤组织比较近的淋巴组织。CD74主要在远离肿瘤组织的淋巴组织区域表达。而IGLL5则是在距肿瘤组织更近的淋巴区域表达。
Figure 4.PCA on an individual section and spatial heatmaps.这篇文章的内容就是这些,其实总体来看内容非常简单,就是分析肿瘤异质性情况,拿一些marker基因进行说明,并不是去讲一个完整的story出来。
按照这个文章的思路,我们可以总结几点利用空间转录组做肿瘤异质性需要考虑的地方:
1. 选择感兴趣的癌症样本的活检样本,可以考虑要做同一个病人的原位癌和转移癌的异质性,也可以考虑做不同病人间的原位癌或者转移癌的异质性,当然,同时做也是可以的。每个样本可以考虑做2个重复,避免出现实验层面的影响,目前10x Genomics的芯片是4个捕获区域,做两种样本是完全合适的。
2. 组织切片需要有经验的病理学家进行注释,这一点很关键,一般的病理室大夫可能只能注释出来肿瘤区域,但是其他区域并不一定能够清晰注释出来,这会对后续对应的基因表达分析造成麻烦。
3. 数据量,我们不能说多少就能满足分析,目前10x Genomics建议的是0.05M/spot,但是这只是个推荐的数据量,不能说对所有的样本都适用,本文是测到接近饱和了,不过才3000个基因每个spot着实不多,可能也跟捕获区域本身的探针数量有关系,现在10x的增加了,基因数应该还会再提高,有经济能力的建议尽可能测饱和,避免漏掉丰度较低的基因转录本。可以先按0.05M/spot去做,分析下饱和度,不行再对文库进行加测,能达到80%以上应该是能够满足分析要求了。
4. 提前查文献,找一些marker基因,一方面看异质性,另一方面与病理学家注释区域去比较一下,证明我们的方法是没有问题的,然后还可以通过不同区域差异表达基因的比较去寻找新的marker基因,甚至是治疗靶点。
5. 空间转录组做肿瘤还有一个重大意义,就是早诊,基因表达数据结合病理学家注释的结果一起去看,能够避免很早起的癌症,难以通过病理注释出来的问题,一些不明显的早期发生的肿瘤区域,在marker基因表达数据上会比较显著,可以协助医生判断癌症发展阶段,及时采取对应的治疗措施(这或许才是该技术长期发展最大的价值)。
6. 空间转录组技术还是起步阶段,从文章发表的角度来讲,本文这样一个工作能发表在cancer research上着实很划算。目前可以说,还是在利用新颖的技术作为亮点发表文章,所以对文章的故事性要求较低,换不同的癌种,采用类似的思路来做是极有可能发表不错的文章的,有兴趣的可要抓紧了,过了新技术应用的一两年的发展热潮,再发表高水平文章就比较困难了。
「2019年11月09日 ·北京」
网友评论