文献题目:Interrogation of Enhancer Function by Enhancer-Targeting CRISPR Epigenetic Editing
发表于2020年1月Nature Communication
这是一篇长文,基本是把文献翻译了一遍,有些图没有放,有的段落也没有逐字逐句的翻译,但是这篇学习笔记还是一个字一个字码起来的~有的地方翻译的有些生涩,感兴趣的同学可以下载全文去看。这篇文献还是很不错的,尤其是对于研究enhancer的童鞋们来说很值得一读。
摘要
组织特异基因表达要求基因的近端以及远端的顺式调节元件(CRE)的协同作用。其中,基因远端的CRE,例如enhancer的功能分析还存在很大的挑战。这里作者描述了基于CRISPR/dCas9技术的靶向enhancer的表观编辑系统,enCRISPRa 和enCRISPRi,可以在体内和体外有效的研究enhancer的功能。利用双重effector,从而“重新编辑”enhancer相关的染色体修饰,作者展示了enCRISPRa 和 enCRISPRi通过重构sgRNA靶向的enhancer和相关基因的表观谱,从而调节基因转录。与现存的方法比较起来,这个系统展示了更强大、脱靶率更低的的enhancer扰动活性和基因转录活性。作者利用enCRISPRa进行等位基因特异性靶向TAL1 的super enhancer调节TAL1表达和肿瘤进展。利用enCRISPRi 的knock-in小鼠,lineage特异的enhancer上单位点或者多位点扰动在体内证明了在造血过程中发育的enhancer的lineage限制的重要性。因此,靶向enhancer的CRISPR的表观编辑提供了研究在天然状态下增强子的功能的机会。
在阅读文章之前,先简单的说一下什么是CRISPRi和CRISPRa,我的课题里有一部分内容用到了CRISPRi这个技术。简单来说,CRISPRi,称为CRISPR干扰,通过dCas9与阻遏结构域(如KRAB)融合,实现高效的转录沉默。而CRISPRa,称为CRISPR激活,与转录激活因子(如VP64和p65)融合的dCas9可靶向promoter和enhancer区域,导致基因表达上调。为了增强激活效率,dCas9融合体需要招募多个激活结构域。目前已经有几种系统,包括多重融合体(VPR,即VP64、p65和Rta5的三重融合体)、使用蛋白质支架(如SunTag系统),以及使用RNA支架(如Synergistic Activation Mediator complex)。
前言
哺乳动物基因表达要求基因近端的启动子和远端的CRE(例如转录enhancer)来调节。人类表观组的系统的注释已经通过相关特点(例如染色体可接近性和组蛋白修饰)鉴定了百万个假定的CRE。然而,这些元件在自然状态下的体内功能分析还是非常困难的。这是由于现有的技术对enhancer活性的测定都没有在天然状态下的染色体结构上分析,还有一部分原因是基于这些技术的发现并没有与特异的靶基因或者发育过程中的细胞功能有因果联系。enhancer是顺式调节元件,它本身是一段DNA序列,它可以在特异的细胞类型或者暂时的细胞状态下结合并调节转录因子和组蛋白调节因子。
一般来说利用表观特征(例如DNase I超敏或者 ATAC-seq)和组蛋白marks(H3K4me1/2 和 H3K27ac)来推断enhancer。与基因的近端启动子不同的是,enhancer可以在离基因很远的地方调节基因转录,而且与基因的方向没有关系。Reporter分析是用来检测不同细胞模型里enhancer活性的传统方法。与高通量测序结合起来,reporter分析可以同时定量分析上千个enhancer的转录活性。与转基因结合起来,体内reporter分析可以评估在发育过程中enhancer的功能。这些方法分析转录因子介导的转录活性是非常强大的,但是这些也有一些限制性,这些方法通常使用SV40启动子,而不是enhancer的内源启动子,从而无法鉴定enhancer的靶向基因,也无法研究天然染色质上多个enhancer的组合调控。另外,传统的基因靶向或者基因组编辑方法已经用于在细胞系里或者动物模型里KO或者突变特异的enhancer。然而,这些方法都是低通量并且耗费人力。
近日,通过改变CRISPR/Cas9系统调节内源基因表达的方法有了很大的进步。通过结合dCas9(deactivated Cas9)和多种活化因子(例如VP64和p300)或者抑制因子(KRAB,LSD126和DNMT3A/3L)的结构域,在转录水平干扰特异基因。而第一代dCas9的activator或repressor复合物(例如dCas9-VP64和dCas9-KRAB)与基因近端启动子结合时,可以有效地调节转录,从而发挥作用。而当其目标区域远离近端启动子时,效率迅速下降。第二代dcas9的activator通过dacas9融合和(或)MS2-MCP,利用效应蛋白的结合提高靶向的基因调节效率。然而,这个策略并没有涉及到enhancer靶向的表观修饰。这篇文章里,作者描述了enhancer靶向的CRISPR表观编辑系统,enCRISPRa和enCRISPRi,利用dcas9双效应分子来研究enhancer的功能。利用人类β-globin位点控制区域(LCR),癌基因TAL1超级enhancer(SE),和造血谱系特异性enhancer为例子,阐述enCRISPRa和enCRISPRi在体外和体内enhancer功能。
Results
(一)enCRISPRa系统的构建,激活enhancer的活性
为了评估基因远端的enhancer的功能,作者设计了基于dcas9的enhancer靶向的表观干扰系统,来验证enhancer的调节作用。作者在sgRNA载体上加了两个MS2发夹结构,这个结构可以被MCP RNA结合蛋白识别。
为了enhancer的活性 (enCRISPRa;图1a),作者用组蛋白乙酰转移酶p300的核心区域(可以催化组蛋白H3的Lys27乙酰化)融合dcas9;与MS2-sgRNA序列与MCP-VP64一起招募转录复合体至promoter区域。作者之后又构建了第二版的enCRISPRa,这个新版的结构是dcas9-VP64+MCP-p300的结合。因为H3K27ac是活化的enhancer的标志,利用doxycycline (Dox)诱导表达的dcas9-p300,sgRNA-MS2或MCP-VP64 ,作者构建了enhancer靶向的双activator系统(图S1a)(这里称双效应系统是因为,以往的CRISPRa系统都是单效应因子p300或者VP64,这里作者把两个效应因子放在了一起)。(这里说的比较乱,简单的说就是作者构建了很多种载体,是为了之后测试哪一种载体能最大程度激活enhancer的活性)
图S1a为了检测 enCRISPRa在调节CRE的活性,作者以enCRISPRa或单效dCas9为靶点在HEK293T细胞中使用序列特异性sgRNAs激活已知的MYOD增强因子(图1b)。与没有转染的细胞相比,dcas9单独或者dCas9-VP64对MYOD的表达没有影响,而dCas9-p300显著的激活了MYOD的表达,高达17.7倍。重点是dCas9-VP64 + MCP-p300 (VP)或者dCas9-p300+ MCP-VP64 (PV)的结合可以增强MYOD的活性(分别是26.5倍和32.8倍),说明双效应体enCRISPRa产生了对靶向enhancer更有效的转录活性。
图1b之后作者主要研究人类β-球蛋白基因座上的HS2 enhancer(图1C)。β-球蛋白基因座包含5个β-样球蛋白基因(HBE1, HBG1, HBG2, HBD 和HBB),这些基因被共有的上游enhancer簇和基因座控制区域(LCR)调控。β-球蛋白基因座控制区域由5个离散的DNase I 超敏感位点(HS1-HS5)组成,其中HS2在转基因分析中显示其功能是红细胞特异性的enhancer。与MYOD的enhancer相似, enCRISPRa靶向的HS2的enhancer相比于单效应dcas9来讲更加可以激活β-球蛋白基因(HBE1,HBG1/2 和HBB)(图1C)。两种enCRISPRa版本的激活效应没有很大的区别,作者主要使用 dCas9-p300 + MCP-VP64(PV)这一版本来进行后续的验证试验。
图1C接下来作者比较了enCRISPRa和二代dCas9激活方法(例如dxCas9-VPR22, SunTag17和SAM19)(图1D,E)。
图1D 图1E很明显的,enCRISPRa 相比于其他的dcas9激活系统更加提高了MYOD 的enhancer活性(图1D)。在β-球蛋白基因座,enCRISPRa介导的HS2 enhancer的活性,使得HBE1, HBG1/2 和HBB表达水平分别提高了23.6、40.6和13倍(图1E)。这个激活的水平明显比其他dcas9系统要高很多。
而enCRISPRa对于基因近端的promoter的激活效应就不是很好,作者利用enCRISPRa的方法检测了对IL1RN和OCT4的promoter的激活效应(SFig1b)。
图SFig1b作者还比较了单效应的CRISPRa和双效应因子CRISPRa系统的激活效率(图SFig1d),结果说明将双效应因子p300 和VP64与MS2-MCP支架结合在一起的enCRISPRa系统能够最大程度的激活enhancer的活性。
图SFig1d尽管不同的单效应、双效应因子激活系统有着不一样的激活效率,但是这个激活效率是根据不用的靶标基因、不同的细胞系、转染条件、分析基因表达的时间、以及你设计的sgRNA的位置而变化的。因此,作者使用了相同的细胞系、相同的sgRNA序列、相同的转染条件来比较不同dcas9激活系统的效率。
(二) enCRISPRi 系统:抑制enhancer 的活性
接下来作者还构建了双效应表观编辑系统enCRISPRi-LK(图2a)。这里作者把dcas9与LSD1 (或KDM1A)融合,LSD1作为组蛋白赖氨酸特异性去甲基化酶,可催化移除enhancer相关组蛋白H3-赖氨酸的单/双甲基(H3K4me1/2),与MS2-sgRNA一起招募MCP-KRAB抑制区域。
作为一个原理验证,作者利用enCRISPRi靶向K562细胞里HS2 enhancer,这个细胞系表达高水平的β-球蛋白基因(HBE1, HBG1/2和 HBB) ,作者设计了4个独立的sgRNA(sgHS2-1 到 sgHS2-4),还有一个对照sgGal4(图2b)。作者还构建了第二个版本的enCRISPRi系统,是dCas9-KRAB + MCP-LSD1 (enCRISPRi-KL) 的组合(图2a,图sfig1a)。结果看来任何一个enCRISPRi版本都可以明显的抑制β-球蛋白基因(图2b)。与单效应dcas9系统相比(dCas9-KRAB (K) 和dCas9-LSD1 (L) ),双效应系统显示出更强的抑制效率(图2b,图2c)。
图2b 图2c:K562细胞的RNA-seq结果,另外,ChIP-seq分析结果显示dacs9结合的明显富集在HS2的enhancer上(相比于sgGal4)(图2d)。
图2d作者利用enCRISPRi检测靶向单独或者多个β-球蛋白 LCR的enhancer的效率(图2e)。作者使用的是enCRISPRi (LK)版本。分别针对LCR enhancers设计sgRNA(sgHS1 到 sgHS5) ,并且对HBG1/2也设计了sgRNA (sgHBG)。β-球蛋白基因座两端有两个CTCF相关的绝缘子元件(在HS5和3′HS1附近),所以作者在β-球蛋白绝缘子外2-4kb的地方设计了sgRNA (sgCTCF1和 sgCTCF2),还设计了β-球蛋白基因座拓扑相关结构以外区域设计了sgTAD1和sgTAD2,并针对其他染色体设计了sgRNA(sgCtrl; chr2:211,337,408–211,337,427)(图2e)。结果显示共转染5个sgRNA的 β-球蛋白基因的表达量相比于单个sgRNA并没有进一步被抑制(图2f)。
图2e 图2f当靶向基因近端的启动子时,基于dCas9的表观修饰可能会阻碍转录因子的结合,或干扰转录起始和延伸复合物的形成。相反,enhancer的抑制要求干扰特定enhancer调节转录因子的功能,并影响它们的结合活性。作者推断enCRISPRi 靶向近端的enhancer中心可能达到最大效应,相比于远端enhancer序列。为了证明这个推断,作者利用enCRISPRi靶向DNase I超敏活性(DHS)在HS2区域的峰,和峰的上游0.5/ 2.5 kb以及下游0.5 /2.5 kb(sgHS2-2.5k, sgHS2-0.5k, sgHS2 + 0.5k和sgHS2 + 2.5k; Fig. 2e)。结果显示随着远离enhancer中心的位置, enCRISPRi的抑制效果明显降低(图2f)。
这些结果不仅建立了改进的针对enhancer扰动表观编辑系统,还证明了表观调节因子和转录效应因子的结合可以更大程度的扰动特异基因的转录。之前的系统CRISPRa (p300/VP64) 和CRISPRi (LSD1 /KRAB)被用来检测启动子和增强子对于转录的调控,但是之前没有人把两种效应因子结合在一起使用。所以enCRISPRa 和enCRISPRi 系统是第一次在单个dcas9复合体里结合了 p300–VP64、LSD1–KRAB,从而增强、抑制enhancer的活性。
(三)利用enCRISPRi进行位点特异性的表观编辑
为了确定enCRISPRi在表观谱上的影响,作者进行了多个Chip-seq实验,包括检测增强子相关活性组蛋白marks(H3K4me1, H3K4me2 和H3K27ac)、抑制染色体相关的H3K9me3 和 H3K27me3、造血谱系主要调节的转录因子(GATA1 和TAL1),以及CTCF。对照是不靶向任何基因的sgGal4、或sgHS2(图3)(不得不说这实验室真的是有钱。。)。
与对照组相比(C),dCas9-LSD1 (L) 和dCas9-KRAB(K), 双效应抑制因子系统 enCRISPRi LK 和 KL在HS2位点上的H3K4me1和H3K27ac结合明显降低(增强子相关激活组蛋白marks)。但对于其他位点没有影响。两个版本的enCRISPRi LK 和KL提高了HS2 enhancer的抑制组蛋白marks(H3K9me3)。值得注意的是,enCRISPRi也大幅的抑制了在β-globin基因近端启动子和基因body上的H3K4me2和H3K27ac。这些结果说明了enCRISPRi介导的enhancer抑制导致靶向的enhancer和相关基因启动子的表观变化,主要是通过抑制了enhancer和promoter的相互作用。两个版本的enCRISPRi (LK or KL)相比于dcas9-KRAB或单独dcas9-LSD1而言,同时促进了H3K9me3的增加和H3K4me1/2的降低。说明了两个抑制蛋白的协同作用。
dCas9-KRAB或者dCas9-LSD1单独作用对GATA1和TAL1的结合都只降低的不多,这两个造血系统转录因子是HS2 enhancer的所必需的,但是如果使用enCRISPRi就可以明显的抑制GATA1和TAL1对HS2 enhancer的结合。虽然dcas9的结合可能会干扰TF–DNA的相互作用,如果sgRNA和转录因子靶向序列重合的时候,但是在这个结果来看,GATA1/TAL1对DNA结合的改变可能是因为dcas9抑制因子改变了HS2的表观谱。截至目前,作者在体外实验证明了双效应因子系统可以更加有效的对靶序列进行表观修饰。
(四)癌基因的超级增强子的等位基因特异性干扰
证明了enCRISPRa 和enCRISPRi在体外的效率,下面作者测试了是否可以在体内通过靶向疾病相关基因CRE来调节基因的转录和疾病表型。在原癌基因TAL1的一个enhancer上游8kb的地方在淋巴细胞白血病细胞系和患者体内发现有频发突变。杂合体细胞突变通常是通过在TAL1的enhancer序列上插入几个核苷酸来获得的。为了验证enCRISPRa在体内的活性,作者检测了在Jurkat细胞里enCRISPRa介导的TAL1 enhancer的活性。作者设计了两个sgRNA靶向突变的等位基因,这两个sgRNA带有12bp的插入序列(sgMut1 和 sgMut2)(图4a)。作为对照,作者又设计了两个sgRNA同时靶向WT和突变的enhancer序列(在靠近12bp插入序列的位置,命名为sgWT1和sgWT2)。
在Jurkat细胞里共表达enCRISPRa和设计的那些sgRNA,作者检测了sgRNA的靶向性(图4b),发现sgMut1 和sgMut2明显的结合Mut等位基因,不结合WT等位基因;而sgWT1和sgWT2对于WT和Mut的结合能力相似。在K562细胞里,这个细胞缺乏Mut等位基因,所以可以看到dcas9几乎不和WT等位基因结合。说明了enCRISPRa的等位基因特异性靶向效率很高。
图4b更重要的是,作者发现了TAL1的mRNA和蛋白水平被sgMut和sgWT诱导表达(图4c,d)。升高的TAL1的表达明显的促进了细胞生长(图4e)。由于sgMut1和sgMut2特异靶向突变的enhancer序列,这些结果说明突变的TAL1等位基因特异的改变,导致了TAL1转录的活化。相反的,作者发现使用enCRISPRi介导的TAL1的SE抑制(使用相同的sgRNA)能够明显的降低TAL1的mRNA和蛋白的水平,并抑制细胞生长(图就不放上来了)。
图4c,d,e之后,作者把转染了enCRISPRa的T-ALL细胞注射进小鼠(NSG)体内,发现enCRISPRa-介导的TAL1 enhancer的活化促进了肿瘤的生长(图4I,j)。白血病表型也显著的增加,在外周血(PB)和骨髓(BM)里浸润的白血病细胞也升高了(图4k,l)。这些结果不仅说明了TAL1癌基因SE的功能作用在T-ALL发展中的建立,也证明了enCRISPRa 和enCRISPRi 的等位基因特异性干扰疾病相关enhancer在体内也非常有效。
图4I,j,k,l(五)在可诱导的knock-in小鼠模型中应用enCRISPRi
在体内系统性的分析enhancer功能至今都是比较困难的。为了验证enCRISPRi在体内对enhancer的干扰作用,作者构建了位点特异性的dcas9-KRAB的knock-in嵌合体小鼠,这个dcas9-KRAB是由TRE的启动子控制,可进入Col1a1位点(图5a)。囊胚注射胚胎干细胞,筛选后代,把筛选好的细胞植入小鼠体内,这里用的小鼠是dCas9-KRAB::Rosa26-M2rtTA杂合体(或纯合dCas9-KRAB KI小鼠)(图5b)。
为了检测dcas9-KRAB在小鼠造血系统发展过程中的表达,作者用小鼠的全血和骨髓和脾细胞去做分选,根据红系(Ter119+),B淋巴系(B220+),T淋巴系(CD3+)和骨髓来源的细胞(Mac1 +Gr1+)分(加或不加DOX诱导dcas9)。结果(补充图6,我就不放了)显示,DOX诱导的dcas9-KRAB表达并不影响造血系统的功能。也不影响骨髓和脾的造血干细胞群。说明dcas9-KRAB表达对小鼠血液功能没有副作用。
(六)谱系特异性enhancer在体内的功能
造血系统作为一个范例,可以供人们研究控制干细胞分化的相关谱系特异性的转录因子。自我更新的造血干细胞(HSC)通过一系列的祖细胞层级,产生所有成熟的血细胞谱系。在骨髓移植中,HSC可以为受体重构整个血液系统,然而祖细胞却不能。HSC自我更新和谱系分化被一系列的转录因子调控,许多转录因子的功能有着高度谱系特异性和组织特异性。
接下来,作者设计了一个体内实验enhancer干扰试验,用dCas9-KRAB KI 小鼠与sgRNA-MS2 和MCP-LSD1结合在一起,在体内组装enCRISPRi复合体(图5a)。然后作者用enCRISPRi的方法,验证了谱系特异性enhancer相关造血转录因子的功能(图5d)。作者集中在5个转录因子上:Cebpa,Spi1 (or PU.1), Gata1, Gata2和 Runx1。这些转录因子对HSC功能和谱系分化起着重要作用。每一个基因都有一个或多个被注释的enhancer(根据ATAC-seq和H3K27ac的Chip-seq结果)(图5e,f)。
作者针对每一个enhancer设计了2个或3个sgRNA,对每一个启动子也设计了2或3个sgRNA作为阳性对照。还有另外10个nontarget的阴性对照。将这些sgRNA分成5个库,每个库里有16-20个sgRNA。从dcas9-KRAB KI小鼠体内分离出CD45.2+谱系阴性HSPC细胞,用retro病毒转染这5个sgRNA库(MOI<=0.5),保证每一个细胞里不多于一个sgRNA。这些转染的细胞被植入CD45.1+的接受致死辐射量的小鼠体内,DOX诱导dcas9-KRAB表达16周。此时,所有供体来源的造血细胞(CD45.2+)代替了“短命”的祖细胞。作者收集骨髓移植之前的细胞(T1)作为对照,受体外周血里的供体来源骨髓细胞HSPC和成熟髓细胞(Gr1+Mac1+),B细胞(B220+)和T细胞(CD3+)(T2)(图5d)。
图5d作者进行了5个独立位点特异性enhancer干扰筛选,每个有独立的两次实验重复,分别针对Cebpa, Spi1, Gata1, Gata2和Runx1(图5e,f)。Cebpa的缺失或者其下游的enhancer(E4,图5e)的缺失导致髓系分化的缺陷,但不影响淋巴细胞生成。另外,cebpa E2 enhancer也是体内髓系生成所必需的,而E1和E3不是必需。
图5e,f:(e)体内enCRISPRi 干扰 Cebpa CREs 揭示造血过程中谱系特异性所必需的Cebpa enhancer。Waterfall plots结果显示特异靶向sgRNA(绿色和红色的点)和非靶向的sgRNA(灰色的点),纵坐标是标准化log2倍数变化(T2比上T1)对于spi1位点,作者设计的3个sgRNA都可以很好的去除-14kb的enhancer活性(髓系。而非B或者T)(图5f)。这些结果说明了spi1在正常髓系细胞发育的作用,证实了体内spi1上游的enhancer的调节作用。而对于Gata1而言,靶向其启动子的sgRNA只能轻微的抑制它的表达,靶向其增强子的sgRNA完全没有抑制效果,而且Gata1增强子表现出了染色体可接近性和H3K27ac的富集(在HSC细胞,而不再B,T细胞里),说明Gata1的增强子并不是HSC分化为成熟髓系或者淋巴系所必需的(图就不放了)。
(七)造血系统多位点enhancer干扰
位点特异性干扰筛选提供了每一个enhancer在相对的基因的“重要性”(local),但是并不能揭示在造血系统里多位点enhancer之间的相对重要性。为了解释这个问题,作者把之前针对5个基因的enhancer设计的所有sgRNA和对照放在一起组成一个大库,进行多位点增强子干扰筛选(图6a )。
结果显示,被抑制的最大的enhancer是Cebpa + 37 kb (E4) 和+8 kb (E2),Gata2 + 9.5 kb (E4)和Spi1 –14 kb(图6b)。而spi1和Gata2增强子的sgRNA只是轻微的被抑制(在B和T细胞里)。这些结果说明造血系统中需要不同的发育enhancer,有些enhancer事参与大部分谱系分化,比如Gata2或者spi1的增强子;而有些是特异性谱系分化必须的(比如Cebpa增强子)。
讨论
本文首先是描述了双效应因子CRISPR表观编辑系统进行位点特异性转录增强子(或CRE)的激活或者抑制系统构建。之后利用构建的系统在体内和体外都进行了验证。该系统可以供人们进行对增强子的研究(生理和病理条件下),从而可以提供enhancer调控的机制。
网友评论