Pre:
之前整理了一个思维导图见:https://www.jianshu.com/p/0241ccba2f29,进行这篇相当于原基础再扩充~欢迎一起讨论!
之前我们讲解过一篇在肺癌中联合基因组、表观组和转绿组进行数据分析。今天介绍的这一篇汤富酬教授联合付卫教授、乔杰院士18年11月30日发表在《Science》杂志上的工作:他们首次从单细胞分辨率、多组学水平(利用他们自主研发的scTrio-seq2手段,在转录组水平,全基因组甲基化水平,全基因测序水平)解析了人类结直肠癌在发生和转移过程中,基因组拷贝数变异、DNA甲基化异常及基因表达异常的特点及相互关系。
一:Abstract& Introduction信息提取
1:结直肠癌(CRC)是一种异质性很高的癌症,造成原因是基因组的不稳定性,表观遗传的异常以及基因表达失调。(PS:根据18年的cancer statics统计,结直肠癌在男性中发病率第二死亡率第三,在女性中发病率第四,死亡率第三[1])
2:传统样本测序得到的信息是包括了多种肿瘤细胞、间质细胞以及免疫细胞在内的成千上万个细胞信息的整合,并不能得到特定类型肿瘤细胞的精确信息,以致无法深入解析肿瘤内部异质性。但是大多单细胞测序工作仅针对单一组学进行研究,无法从多组学层面解析肿瘤细胞的遗传学改变,不能揭示肿瘤进展过程中同一细胞内不同组学间的相互联系。
3:在结直肠癌中首次在单细胞测序层面,整合多组学数据分析同一患者的不同部位(如原位癌,淋巴结转移和远端转移),对肿瘤的异质性提出解读。
4:利用scTrio-seq2手段整合了单细胞全基因甲基化测序(scBS-seq),体细胞拷贝数变异(SCNAs),转录组信息进行分析并且可以有效的提高检测效率。
5:在本研究中,利用scTrio-seq2对12名CRC患者(stage III or IV)进行测序,然后获得了配对的10名患者的原发性肿瘤和淋巴或远处转移样本。在CRC01患者上采取了正常结肠组织和16个肿瘤区域,包括原发性肿瘤(PT4例)、淋巴结转移(LN3例)、肝转移(ML4例)和治疗后肝转移(MP5例)。
6:全基因组DNA甲基化水平和遗传谱系相关,并且癌细胞的DNA去甲基化的程度和异染色质中组蛋白H3K9me3的密度有关。
二:问题思考
1、如何整合多组学信息去鉴定结直肠癌肿瘤细胞的亚克隆?
2、如何证明DNA甲基化谱和遗传谱系之间的关系?
3、和汤富酬教授之前的单细胞工作相比有什么差异?
三:结果
3.1 利用scTrio-seq2 重塑遗传谱系
图二:文章中Fig1图:SCNA谱系分类结果1:利用了TCGA的结直肠癌的体细胞拷贝数变异的数据和CRC01的scTrio-seq2数据结果进行比对。
2:a:遗传谱系的分类结果,分为A和B,A系有A0-A9, B有B0-B1
b:他们从CRC01中的取4部分病灶(分别是ML PT LN ML MP)和癌旁组织(NC)
c:16个样品颜色所对应的区域
横坐标是染色体的分布情况,总坐标是根据单细胞测序的结果划分的亚克隆情况。在热图中,红色代表的染色体增添,蓝色的代表的是染色体缺失。根据SCNA进行分类和分析,分类的指标是:在每个亚型中染色体或染色体臂上的断点是在不同谱系中相对独立。根据这一标准发现了A,B两个谱系,以及12个肿瘤细胞的亚谱系。根据FigS6B,我们可以看出作者根据断点信息一共分出了15个分型。但是在FigS6A中(看亚克隆区域),我们可以看到在A谱系中IX,XIV的断点信息有高度重合,不符合分类指标。剩余的分类结果是可以和图Fig1相对应。举个例子:A1亚克隆对应的是Ⅴ,而Ⅴ的横坐标对应的是10号染色体的畸变,可以对应图FigS6B的具体情况。
图三:FigS6B 断点信息及分类 图四:FigS6A根据得到的分类结果进行谱系的转移的谱系追踪,发现原发位肿瘤的亚克隆组成结构比转移位的亚克隆组成更为复杂。
图五:FigS7A(部分)
Q:如何去解释这个现象呢?
A:异质性的产生是因为同一个肿瘤是由具有多种不同基因组特征细胞构成,每一种细胞构成一个亚克隆(subclone)。因为通常大部分亚克隆里面的细胞对治疗是敏感的,所以很多肿瘤在刚开始接受治疗的时候会缩小。而另外一些亚克隆的细胞对治疗是有抗性的。在没有接受治疗的时候,这些有抗性的亚克隆在整个肿瘤里面的比例一般不高。但是抗性亚克隆在治疗中比率不断增高导致肿瘤复发或者转移。[2]
分析了全基因组拷贝数变异信息,那么全基因组的DNA甲基化的情况怎么样呢?
3.2 全基因组DNA甲基化信息解读
肿瘤细胞的DNA甲基化水平变化(两个分析思路:从谱系分析,从不同的转移位置分析)
图六:Fig2A 图七:FigS8C从图中可以看出检测到肿瘤细胞的DNA甲基化水平普遍低于癌旁细胞(图六和图七),图六中对于不同亚克隆的DNA甲基化水平存在差异,图七中根据DNA甲基化水平可以看到分类效果。同一块肿瘤组织中同一谱系(如谱系A)的肿瘤细胞DNA甲基化水平高度相似,而不同谱系的肿瘤细胞DNA甲基化水平可存在很大差异。
进一步思考问题:这些甲基化差异的位置分布情况有什么特征吗?
图八:Fig2B 不同谱系的CpG位点的甲基化情况肿瘤细胞特异性DNA低甲基化基因组区域显著富集在LTR、LINE等基因组重复序列和异染色质区域,而肿瘤细胞特异性DNA高甲基化的基因组区域显著富集在CpG岛和常染色质区域。
上面的结果从A.B谱系和其亚克隆的结果展示。但是在整个转移的动态变化过程中不同转移灶的DNA甲基化水平有无变化呢?
图九:FigS11 A&B同一个癌症患者同一遗传谱系的肿瘤细胞在从原发灶到转移灶的转移过程中其全基因组DNA甲基化水平相对稳定。而且在全基因组水平,检测到肿瘤细胞的DNA甲基化水平普遍低于癌旁细胞,单个肿瘤细胞全基因组DNA甲基化水平可降低7-36% 进一步探究DNA甲基化的水平和基因表达水平的关系。发现:基因启动子区域的DNA甲基化与相应基因表达关系为负相关,而基因body区的DNA甲基化与相应基因表达呈现正相关。
图十:Fig2C 这里简单的分析了DNA甲基化水平,转录组水平SCNA的分类情况。如果将三者进行联合分析会有什么样的效果呢?他们发现只有其中CRC04患者肿瘤细胞的转录组亚群、遗传亚群(亚克隆)、和DNA甲基化亚群三者之间呈现出一一对应关系,其他三例患者没有呈现对应关系。
3.3 全基因组DNA甲基化信息动态跟踪
图十二:Fig3A全基因组DNA甲基化动态追踪在谱系分析中,NC甲基化程度最高,谱系A高甲基化,到谱系B低甲基化明显。(红色部分代表高甲基化,蓝色部分代表低甲基化。)那么具体高甲基化和低甲基化的区域有哪些特殊呢?
图十三:Fig3B去甲基化和基因组重复序列L1以及H3K9me3标记的异染色质区域正相关,而与开放的染色质区域以及H3K4me3区域负相关。与正常的早期胚胎发育过程中的两次大规模基因组DNA去甲基化相反,相比于L2基因组重复序列,进化上更为年轻、更为活跃的L1基因组重复序列经历了更强烈的DNA去甲基化。
前面比较独立的分析了DNA甲基化水平和全基因组变异水平,那么联合这二者分析呢?
3.4染色体水平的DNA甲基化异常和基因组不稳定性的特点
甲基化程度越高的染色体区域在谱系变化过程中去甲基化越明显,并且和基因组不稳定性高度相关。
图十四:Fig4A&B&C在从肿瘤细胞的不断演化的过程中。在正常上皮细胞中DNA甲基化越高的基因组区域,其DNA去甲基化越强烈在结直肠癌细胞中,有6条染色体(4号、5号、8号、13号、18号、和X染色体)倾向于发生更强烈的DNA去甲基化。其中8号、13号、和18号染色体在TCGA数据库中病例样本以及该研究的12个病例中均得到验证。这6条基因组DNA去甲基化更强烈的染色体中,有5条染色体(4号、5号、8号、13号、和X染色体)也同时显著富集基因点突变(单核苷酸变异)。图C整合TCGA项目CRC01分析表明,三条低甲基化染色体(3号,13号,18号)SCNA程度很高。
主图讲到这里了,回到之前的问题:
1、如何整合多组学信息去鉴定结直肠癌肿瘤细胞的亚克隆?
利用了染色体拷贝数变异先鉴定断点信息,然后根据断点信息的情况对其进行分类。
4、如何证明DNA甲基化谱和基因组谱之间的关系?
从两个角度上看,从DNA甲基化程度和谱系分析,并且分析其与转移位置情况。
5、和汤富酬教授之前的单细胞工作有什么差异?
整理了一张图跟大家分享一下:
图十五:汤教授工作发展
文献thinking:
1:既然已经分到不同的癌细胞遗传亚系,那么对于癌细胞遗传亚系的生理生化研究是否可以进一步阐明?如哪些遗传亚系造成了肿瘤的耐药,侵袭性,肿瘤干细胞特性?
2:为什么只有一个人的三组学数据是统一的?是否还存在其他的表观修饰?基因差异表达是否和一些转录调控原件元件有关如超级增强子有关呢?
3:多个单细胞组学数据整合,是否可以深层揭示肿瘤的发生发展及异质性呢?
4:这篇文章写的实验结果比较多,对于现象后面的解释较少,此外差异基因表达基因的通路研究没有具体说明,有待进一步的挖掘。
5:染色体的不稳定性和甲基化差异的机制有待进一步的研究,作者没有给出具体的解释。
Ref:
1:原文 <u>http://science.sciencemag.org/content/362/6418/1060</u>
2:R. L. Siegel, et al. Cancer statistics, Ca A Cancer Journal for Clinicians, 2018
网友评论