这篇文献,来自于清华大学颉伟教授,19年6月份发表在Nature reviews上的一篇文章《The role of 3D genome organization in development and cell differentiation》(https://doi.org/10.1038/s41580-019-0132-4)
PS:
加上了自己的理解写的文献阅读
pre:
一说到基因,第一反应是什么?是图一嘛?
图一:基因.png
在哺乳动物细胞中,基因组并不以线性分子的形式存在,而是分层次的包裹在细胞核内。既然是分层次的包裹在细胞核中,肯定会经过折叠。从而产生高级构象,基因组的三维构象和细胞命运息息相关。(比如说可以通过构象远距离调控基因表达从而影响细胞的命运,和染色质结构高级相关的生物学过程包括转录,DNA复制,细胞的分化,有丝分裂和减数分裂等)
那么从一维线性到高级结构,都会经历哪些结构和单位呢?
- chromosome territories
- compartments
- topologically associating domains(TAD)
(这些都是被DNA loop和一些边界蛋白如CTCF和cohesion等界定的)
3D基因组的构象在动物发育期间是高度动态的,包括在配子发生,早期胚胎发育等生物学过程中。在过去,由于研究3D基因组的工具有限,在这些关键的发育事件背后的染色质结构的分子基础的研究具有非常大的挑战性。简单梳理一下,研究染色质构象的一些实验技术。
1 荧光原位杂交(FISH)
荧光原位杂交(fluorescence in situ hybridization),简称为FISH,不需要放射性元素,利用的是带荧光标记的探针,可以和待检测的染色体或者是DNA进行特异性结合,通过变性-退火-复性。可以在荧光显微镜底下进行观察。利用这个技术,可以去计算不同基因区域之间的位置。
2 CRISPR–Cas基因编辑技术和显微镜结合
利用基因编辑技术对基因组区域进行编辑,然后可以在显微镜底下可视化一些基因区域。
3 各种C
包括3C 4C 5C Hi-C等技术。可以染色质构象和DNA的关系。简单来说是需要交联,然后通过超声打断,再做连接,然后pull down下DNA,进行高通量测序。就可以看得到染色质的高级结构(哪里有相互作用,靠的比较紧密什么的)
这篇综述,主要是讲述了以下几个方面:
1 在细胞的生命历程中,3D基因组的最新发现
2 染色质的重建过程和转录调控的关系
3 最新的关于3D基因组和人类疾病的关系研究进展
Part 1:3D基因组的分层结构
1.1 染色质的“领地”(territories)和“室”(compartments)
图二:territory & compartment1.1.1如何理解 territories和compartment?
在细胞中,每个染色质都有自己的territories (“领地”)。这个是通过显微镜观察和各种C验证出来的。在每个“领域”内。基因的区域不是随机分布的,它的分布和转录活性是有关系的。有可能被转录的基因丰富区域往往位于染色体区域的边界附近(但是会有一些例外,比如说Hoxd基因在小鼠胚胎第9.5天胚胎的肢芽中被激活,但是没有检测到它在染色体边界处活跃)
不同的染色质“领地”可以混杂,特别是还会出现“领地”界限不清的现象。在较小的,兆碱基(MB)范围内,具有相似染色质特征的基因组区域倾向于相互作用。转录活跃区经常会和其他的转录活跃区有相互作用,导致了基因密度,染色质的聚集和组蛋白修饰的激活。相反的,转录不活跃的区域(异染色质)通常也会相互作用。
这些染色质相互作用聚集区域,通常被称为compartment A (Active). compartment B(inactive) ,图二b图比较清楚,通过了Hi-C和显微镜观察(microscopy- based )等验证。
1.1.2 染色质区域的空间分离和各种核结构有关
compartment A经常在核内部中发现,而compartment B优先与形成核膜结合,形成核膜相关结构域(LAD Lamina associated domian).或者是核仁。
(ps:个人感觉就像是compartment A 像夹心一样,被夹在compartment B中间)
在人的成纤维细胞中,约40%的基因组与核纤层蛋白结合。在小鼠胚胎干细胞分化为神经前体和星形胶质细胞的过程中,基因组和核膜之间的相互作用模式在数百个位点逐渐改变。染色质的空间分离不限于染色体内区室,也适用于来自不同染色体的区室。
不活跃的染色体间中心被发现是围绕核仁,并含有着丝粒和核糖体DNA的区域。这个发现和之前的染色质domain观察一致。相反的,激活的区域会形成核斑(nuclear speackles)
图三 核斑 核纤层 核的示意图
从机制上来说,靠近核外围的基因分布比较少的compartment B的分布取决于lamin B 受体,Lamin A , Lamin C.当这三种蛋白都缺失的时候,会导致细胞核内的异染色质的重新定位。
1.2 TAD和 loop domains(“环结构域”)
另一个染色质的结构类型是TAD(topologically associating domain).TAD的发现主要是通过Hi-C和5C的结果,通过正方形对角线形式展示出来。已经有研究提出TADs的一个主要功能是限制启动子-增强子之间的相互作用。TAD边界优先在细胞类型中保持稳定,其中一小部分边界显示细胞类型特异性。
在哺乳动物中,TAD边界是由锚定蛋白CTCF(CCCTC-binding protein)和cohesion等组成。其他的边界因素包括了组蛋白修饰,比如说H3K4me3 H3K36me3 以及一些管家基因。
1.2.1 cohesin complex (黏连蛋白复合体) & loop extrusion
cohesion蛋白复合体,可以形成环状结构并且在染色体上移位。cohesion复合体通过NIPBL(SCC2)和MAU2姐妹染色体凝聚因子同源物(SCC4) 定到染色质中 (图四中紫色的点点),并且通过WAPL蛋白释放染色质的结构。cohesin复合物在染色质上的移动需要ATP,如果抑制了ATPase 结构域(SMC3)可以抑制其活动。转录也可能有助于cohesin沿染色质移动以重构其结构。
图四 TAD中 loop extrusion模型
Tips:
"loop extrusion"的模型,是用于解释TAD的形成。在这个模型中,cohesin复合物会挤压染色质改变其空间构象,直到遇见了TAD边界-------CTCF。这个模型,解释了TAD内部的一些Loop的相互作用,但是TAD和TAD之间的相互作用被削弱了。在图五中,loop是热图中的尖尖peak!
图五 interphase loop extrusion model
如果改变CTCF 的motif的方向,就会影响loop和TAD的形成。这些结果都说明了CTCF和loop形成的关系。在最近的一项研究中发现,通过4C技术,敲除一个局部的CTCF的boundary,是不会影响这个local的染色质相互作用的模式。虽然通过5C或者是Hi-C没有相关的报道。可能说明,别的一些因子(除了CTCF和cohesion)也会对TAD的形成有影响。
虽然通过很多数据,可以证明TAD的存在,通过单细胞的Hi-C数据,TAD的存
在不会是那么的稳定。比如说最近的文献报道了小鼠的single-cell Hic分析显示了细胞特异性。还有用超高分辨率的手段分析了人细胞的domain bounadries。发现细胞和细胞的不同但是CTCF和cohesion结合位点是一样的。有趣的是,当把cohesion敲掉后(CTCF还存在),类似TAD的结构还存在。现在不清楚的是,cohesin-independent 和 cohesin-dependent的TAD的结构有什么本质区别,但是还是有待于发掘的。
1.3 TAD和compartment的调控
染色质的TAD和compartment可能是受不同机制的调控。越来越多的证据表明,他们之间的调控方式可能是对立的。当把cohesion复合物中的Rad21敲除或者把小鼠中的NIPBL敲除后,导致了loop domain的消失但是出现了增强的更细的compartment划分。通过更高精度的Hi-C数据,发现compartment和转录活性是有关系的。在哺乳动物中,更精细的compartment 有时会被CTCF和cohesin混淆,但是当把这些都去掉的时候,会更加清楚。可能是区室化(compartmentalization)可以促进转录的激活或者是抑制转录通过将基因富集到核区(这个核区可能是转录富集或者是缺乏)
loop extrusion的模型是可以提供局部的promooter-enhance的相互作用,有趣的是,cohesion缺失可以造成超级增强子的出现。即使是来自不同染色体的,也可以在空间上选择性地进行共域化,形成转录因子结合域簇。一项最近的研究显示,转录共激活因子BRD4和复合亚基(MED1),在超级增强子上都富集。可以形成核点(nulcear puncta),提示转录因子也和compartment的形成有关系。
1.4 3D基因组与配子发生
生命的起始是由于精子和卵子的融合,这些配子的形成是通过非常精细的过程(减数分裂),PGC: Primodial Germ Cell,即精子或卵子的前体,在形成配子的过程中,会发生一系列的表观遗传学重编程。在这个过程,精子和卵子的形成是不一样的。卵子在形成的过程中,会积累大量的RNA和蛋白,为后续的胚胎发育做准备。但是精子不一样,会采取高度紧缩的染色质和结构。
1.4.1 精子的发生过程中基因组织结构
在哺乳动物中,精子的基因组是由鱼精蛋白包裹的,只有1-15%的DNA是由组蛋白包裹的。精子的DNA,会被卷成巨大的浓缩的鱼精蛋白环。在Hi-C数据中,精子比ESC细胞和成纤维细胞有更多的染色质的互作。而且在小鼠中,精子的compartmentA/B 是和体细胞的分布模式比较类似的。cohesion和CTCF的绑定位置也比较相似。
在整个减数分裂的过程中,TAD被去掉了的时期是同源染色体配对的时期。而转录活性可以很大程度上独立于TAD时期。可以理解的是,这一观点符合CTCF对于维持联会复合物和同源重组的必要性这一概念。compartmentA,富集在减数分裂时期双链断裂同源重组的位点。此外,在来自恒河猴的粗线期精母细胞中,出现了一种新的locol区室,称为“refined A / B区室”,其在转录区和非转录区之间交替。它的分辨率要比A/Bcompartment要高。在小鼠的refined A/B compartment中,我们可以看到一些"hub"或者是“point interaction”(点互作) ,但是在精子的X染色体是看不到的(减数分裂性染色体失活)。值得注意的是,在小鼠sycp2突变和top6bl突变中(这两种突变都是联会和同源染色体分离符合蛋白中一部分),refined A/B compartment结构会更弱。现在还是不清楚,为什么在精子中,没有TAD和refinedA/B的出现。
1.4.1 卵子的发生过程中基因组织结构
与成熟的精子不同的是,在受精前卵细胞会停滞在减数分裂第二次时期,缺乏TAD和compartment。(图七)有意思的发现是,卵细胞减二中期的染色质构象和正常细胞的有丝中期很像。但是有关的结构蛋白和表观修饰还在发现中。如果是这样的话,是否会传递父母亲的印记呢?
现在有两种卵细胞,核仁周围有环装染色质(surrounded nucleolus)包围的称为SN卵母细胞,没有环装染色质包围的成为NSN卵母细胞。从NSN到SN会伴随着转录沉默和大量的染色质收缩。而且SN卵细胞会显示出更广泛的染色质间的互作。总之,这些数据显示了,卵细胞的染色质会经历一个动态变化。
图七 卵细胞减数分裂过程中的3D结构示意图
1.5 早期发育的动态变化
早期胚胎发育过程中,3D基因组是动态变化的。通过电子成像显微镜可以看到在小鼠的胚胎中,可以看到大量的分散的染色质。然而,在1-细胞到2-细胞的转变过程中,大量染色质浓缩,导致在核膜附近聚集的大染色质块的形成。最近有一些研究用低起始量的细胞在胚胎植入前看了高级结构的重编程过程,和电子显微镜的数据一起分析。发现,早期胚胎中含有这些TAD,compartment的结构,但是比较弱。(和结构松散有关吗?)
当把卵母细胞中的Rad21敲除后,发现合子中几乎不含TAD和loop,相反的,当敲除了WAPL(引导cohesin结合)后,cohesin的结合时间变强了,TAD和loop反而增强了。这些结果说明了,cohesin对早期胚胎的TAD的调控有关系。在8细胞前(胚胎移植前),高级结构的建立速度非常缓慢。在早期发育期间,两个亲本基因组的3D基因组结构也经历等位基因特异性重编程。在1细胞时期,母本的“区室化”比父本弱很多。染色质结构的等位基因差异可以在8细胞晚期发现,通过分析发现,在8细胞的晚期仍然有部分的亲本的染色质分离。值得注意的是,最近的一项研究表明,小鼠受精卵中存在两个双极纺锤体,使得亲代基因组在第一次卵裂时保持分离。
有趣的是,在早期胚胎发育过程中的染色质结构重编程伴随着表观遗传修饰。
比如说,与B室区域相比,A区室域的DNA在小鼠植入前胚胎中更快地去甲基化,在胚胎外组织中更有效地重甲基化。这是因为区室A更容易接触到甲基化酶和去甲基化酶(有待验证)。
在核移植的老鼠和猴子的胚胎中加入编码H3K9me3,KDM4D,KDM4B或者是组蛋白去乙酰化酶的mRNA,可以让促进其发育。因为H3K9me3参与异染色质的形成(乙酰化也是),加入mRNA可以促进染色质结构松散。
从早期小鼠胚胎的Hi-C分析中一个惊人的发现是,在TADs建立之前,ZGA发生在2细胞胚胎中,那么提出了一个问题,没有TAD的限制,启动子和增强子是如何互作的促进ZGA的呢?可能还有别的精确的机制去保证转录的高效准确。只是现在还不清楚。但是在敲除cohesion的人的HCT-116细胞系和敲除CTCF的小鼠的早期胚胎细胞中,loop和TAD的形成减少了。但是对转录的活性影响并不大。相反的,cohesin似乎对小鼠原代巨噬细胞中近40%的脂多糖诱导基因的正确激活至关重要。用核失活的Cas9方法显示转录可能和TADboundary有关系。值得注意的是,在小鼠中胚胎移植前,TAD比较弱,它需要不断的DNA复制去稳固。但是在人的HCT-116细胞系中不是这么回事。(可能和实验方法有关系),也可能是细胞特异性。
1.6 染色质的划分
在细胞分化的过程中,会出现compartment switch的情况。值得注意的是,这些变化只与基因表达的变化有一定的相关性。当基因座从B换到A compartment时,一部分基因会上调,反之亦然。但是大部分基因不受影响。在细胞分化中,包含了全局的compartment的动态变化,但是具体的细节需要更进一步的了解。
1.7 TAD的动态划分
在细胞分化的过程中,虽然也会有TAD的变化,但是TAD会比compartment更稳定。比如说在不同细胞类型中一些TAD的边界是非常保守的。和人类的ESC相比,分化细胞中,表观修饰活跃区域的TAD出现变化(或多或少)。结果表明,在小鼠胚胎干细胞向神经祖细胞分化的过程中,“metaTAD tree”发生了一定规模的重组。这种染色质重排与基因表达的变化有关。当小鼠胚胎干细胞多能性减弱的时候,CTCF锚定环域的强度增强。‘frequently interacting regions’比TAD结构更小,富含增强子和超级增强子,它和转录活性的强度是相关的!
1.8. 调控元件的互作
与TADs相比,染色质结构的局部重组可能更为广泛。但是由于Hi-C的分辨率不足,继而后续的一些测序技术如(ChIA–PET)144, capture Hi- C145, HiChIP等。通过这些手段可以去分析一些元件和非编码区对靶基因的调控。
1.8.1 启动子-增强子looping(环)互作模式
对于启动子和增强子的互作,提出一种启动子-增强子looping的理论。这种loop是局部的,和由CTCF等锚定形成的染色质loop是不一样的。因子,它是一种互作的loop,无论是通过将增强子和启动子结合在一起,还是通过分离活跃和沉默染色质区域,都可以促进增强子和启动子之间的相互作用这种限制符合模型。但是不会出CTCF的边界,这些相互作用通过cohesin介导的环形挤出促进,这不能超越CTCF常常产生的染色质屏障模型被称为“loop extrusion”,除了这些互作的以外,还有染色质结构“条纹”,倾向于是一个锚定区域和整个domain的高频互作情况。stripe经常在超级增强子处找到,有大量的NIPBL.
图十 architectural “stripes” (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6065110/)CTCF的贡献在于限制增强子功能,但是不直接限制启动子和增强子的互作。除了CTCF,还有YY1也有类似功能。cohesion在不同的启动子和增强子之间的作用也不一样。通过ChIP,cohesin和NIPBL容易结合到顺势元件上。然而,启动子-增强子互作却独立于cohesin.
另一个问题就是启动子-增强子loop和转录调控之间的关系是什么样子?例如,在小鼠胚胎干细胞向神经祖细胞分化,进而向皮质神经元分化的过程中,启动子增强子的接触常常伴随着基因表达的改变而建立。但是enhancer的特异性不强,并且还有stage specific的模式,如人的血红蛋白的表达。(图十一)
图十一 enhancer alternative 这种互作的loop不一定是和激活转录有关。比如说,这种模式可以在基因表达之前就存在,可以和停止转录有关系。很多启动子和基因互作模式和相应信号是相关的在小鼠发育中对Hox基因(同源框基因的子集)的研究表明,预先存在的染色质接触可能有助于募集合适的转录因子以建立组织特异性启动子 - 增强子相互作用。 图十二 稳定和获得 启动子-增强子互作关系
有一些研究表明,在果蝇胚胎中,加入绝缘子,可以有效阻断启动子和增强子的转录爆发活性,另一项研究分析了果蝇胚胎干细胞向神经祖细胞分化过程中形态发生基因shh与其脑特异性增强子之间的关系。值得注意的是,在Shh激活过程中,Shh及其增强子表现出空间距离的增加,而没有形成稳定的染色质环。说明这种互作还是动态的。
1.8.2 和polycomb互作调控网络
多梳蛋白家族和组蛋白修饰在生长发育过程中起着重要的作用。多梳蛋白复合物(多梳蛋白复合物1和2)在对局部和远距离的染色质互作都有很重要的作用。多梳蛋白复合物也会形成类似于TAD的结构域,但是会比TAD更小。值得注意的是,这些多梳相关的启动子相互作用在小鼠ESC中被耗尽,但是当干细胞细胞转变为多能细胞时被重建。该观察结果表明,这种相互作用可能使发育基因在细胞分化中具有转录活性。Polycomb靶基因的相互作用动力学似乎与Polycomb抑制复合物1组分RING1B对这些位点的结合亲和力相关,而不是与H3K27me3的存在相关,H3K27me3是由Polycomb抑制复合物2催化的组蛋白修饰
2:3D基因组与人类疾病
2.1 3D基因组与生长发育相关
染色质的正确折叠对于基因调控至关重要,人们越来越关注染色质结构改变与疾病之间的关系。编码CTCF和cohesin的基因突变和疾病的越来越相关。
在小鼠中,心肌特异性敲除CTCF可以导致心衰(由于缺少染色质的结构和疾病相关基因的失调)
局部染色质的失调还可以导致发育性疾病,在许多情况下,改变的CTCF等可能导致异常的启动子 - 增强子相互作用,称为enhancer adoption“增强子采用”或enhancer hijacking“增强子劫持"
其中一个研究最好的病例是由EPHA4位点染色质结构改变引起的肢体畸形,在人类中,肢体综合征,包括短指,F指综合征和多指征,是由跨越EPHA4的一个TAD边界附近的缺失,倒位或重复引起的。并且研究人员,通过CRISPR-CAS9技术,在小鼠编辑了和人同源基因Sox9TAD(和人的指形成有关的同源基因),得到了类似的结果。 图十四 人类多指形成模型
此外,染色质的状态异常也可以导致TAD的破坏。
例如,8例中染色体异常的断点可以导致MEF2C的抑制表达(它和5q14.3删失综合征有关)。这个染色体的断点可以阻断含有MEF2C的TAD的形成。使用Ensembl资源(DECIPHER)的人类基因组变异和表型数据库中记录的高达11.8%的疾病相关缺失可能涉及"enhance adoption"。 不断增长的染色体构象数据提供了一种极好的资源,可用于重新审视许多疾病的原因。
2.1 3D基因组和肿瘤发生
除了发育疾病以外,染色质结构变异也会导致肿瘤发生。变异通常是由癌基因采用“enhancer adoption” 或者是“enhance hijacking”的方法。在CTCF和cohesin结合位点的基因突变,特别是非恶性细胞中某些结构域边界位点的扰动足以上调原癌基因表达。
比如说,通过观察26种不同癌症的病例,7416个样本,发现一个特定TAD位点的删除会导致IRS4的失调从而导致癌症。同时在这项研究中,染色体的重复导致了IGF2的过表达,和结直肠癌有关系。 图十三 IGF2的过表达和结直肠癌
染色质结构域也可以通过表观遗传机制来影响CTCF
比如说,突变TET蛋白的正常功能,从而在CTCF结合位点引起高甲基化。由此导致的CTCF结合的减少,TADs之间绝缘的丧失,和一种突出的神经胶质瘤癌基因的异常上调。
3:展望
第一,为了揭示精细的染色质结构,目前的Hi- C分析需要非常深的测序乘数。在许多情况下,增强子和启动子之间的loop相互作用很难检测到。因此,如何在高分辨率下更详细地探索染色质结构是该领域的一大挑战。其他全基因组的方法,如捕获Hi- C、ChIA PET、HiChIP和PLAC seq等,虽然目前这些方法通常需要大量的细胞,但可以达到高分辨率和合理的测序深度。
第二,Hi-C数据需要和细胞核内染色质的动态实验结果相匹配。DNA FISH的结果可以得到兆碱基的分辨率。18年出现了一种新的RNA FISH得方法。可以通过追踪新和成的转录本上内含子的情况,显示活跃基因动态变化过程。但是还是需要更高的测序深度和更高的分辨率。
第三,尽管在理解强调染色质结构如何形成的机制方面取得了显着进展,但它们的功能还远未明确。尽管CTCF和cohesin依赖性TAD和环结构域在个体诱导基因的表达中起关键作用,但cohesin或CTCF的缺失似乎不会对稳态转录产生直接的重大影响。在某些发育阶段(如早期胚胎和粗线期精母细胞),在缺乏强TADs和CTCF介导的染色质loop的情况下,转录如何发生?解开这些谜团可能依赖于新技术的发现。
我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=r6fkoz5co8nx
网友评论