这篇笔记来自文章 DamID as a versatile tool for understanding gene regulation https://www.ncbi.nlm.nih.gov/pubmed/30877125
一:介绍
1.1 什么是DamID?
DamID ---------DNA adenine methyltransferase identification(DNA腺嘌呤甲基转移酶鉴定)是一种不需要抗体、固定或pull-down的全基因组蛋白-DNA相互作用的鉴定方法。
识别调控因子与染色质结合的技术对于揭示维持和控制基因表达的机制至关重要。Bas van Steensel 和 Steven Henikoff 在2000年首次提出这种方法。
DamID利用E coli的腺嘌呤甲基转移酶(Dam)去融合目标蛋白。当这个目标蛋白可以结合染色质的时候,那么这个染色质上结合的DNA上的(GATC序列)A会被甲基化。会有一个甲基化敏感的内切酶(DpnI)并且可以被PCR。那么对这个DNA进行测序,然后可以得到全基因组上这个目标蛋白结合的位置信息。通常来说,对照组是没有连接上Dam的表达系统。
1.2 适用于?
适用于蛋白质-DNA相互作用,RNA-蛋白质的相互作用,染色体的富集和长距离的染色质的互作。
1.3 ChIP vs DamID
ChIP是最广泛的鉴定蛋白质染色质结合位点的方法,可以帮助我们更好的理解基因调控。是业内检测全基因转录结合位点的金标准。 ChIP是利用抗体去和目标蛋白结合,然后把和目标蛋白结合的DNA拉下来并且进行测序。
DamID 的好处是可以不用抗体去富集目标蛋白并且进行纯化。前提是这个细胞必须得导入Dam体系。因此DamID受限于一些细胞模型(容易转染的细胞好做点)
ChIP只能是说,提供那个时间点(甲醛交联的时候)的染色质和DNA的互作信息。但是对DamID来说,它是在DamID体系表达之后的几个小时内的DNA甲基化的情况。在体外培养细胞中,DamID是可以去揭示一个染色质的互作的动态变化的情况的。
此外,DamID受限于GATC的motif的DNA序列,但是ChIP是可以提供一个更高的结合分辨率的。但是ChIP存在小问题(比如说实验假阳性,还有一些peak会富集到不相关的基因的启动子上,这些peak是很难和真正的结合位点区分开来的(Jain et al., 2015; Park et al., 2013; Teytelman et al.,2013).现在ChIP被一种 CUT&RUN的技术替代,这种技术不要求甲醛交联,还有具有较低的信噪比。)
1.4 细胞特异性的DamID
之前已经报道了,DamID在果蝇的发育系统中表达并且出现了表型,保持Dam的低甲基化是可以防止过饱和的甲基化,但是过表达Dam具有细胞毒性的机制还没被揭示出。是不是和m6A的水平被提高了有关系呢?腺嘌呤甲基化可能以难以预测的方式干扰DNA复制,转录或任何其他过程。 转基因动物的毒性作用尚未得到广泛研究,因此由于缺乏已发表的数据,不可能说明哪些细胞可能受到影响。
首先Dam必须保持在一个低的表达量防止过饱和的甲基化和细胞毒性。
如何让Dam处于一个低表达的情况呢?
(在不同组织中,细胞的功能不同。存在细胞特异性的基因调控,在组织中去鉴定细胞特异性的调控更加具有挑战性。如果进行组织裂解的话,需要的起始量高,此外还可能会造成一些基因表达的假象。为了解决这种情况,提出了两种DamID的方法)
1.4.1 TaDa
TaDa(Targeted DamID) :这个方法Tony D.Southall等首发于13年的 Developmental Cell ,在果蝇的脑组织里实现,利用Dam和RNA pol II结合并且已经得到了证明。对细胞量的要求量不高,利用双顺反子的结构,并且把Dam的序列放到了ORF(open reading frame)的下游.而且Dam的表达依赖于核糖体和ORF的水平距离的移动实现转录和翻译。
我们来看一下这个图,第一个箭头是primary ORF,红框里是secondray ORF.
在果蝇的脑组织里,他们利用了一个表达系统Gal4/UAS.如果有GAL4的表达,可以与UAS结合,然后导致后面的primary ORF表达,少量的Dam和目标蛋白(POL)表达。反之,没有GAL4,primary ORF表达特别少。secondary ORF基本不表达。
果蝇Gal4 / UAS系统可以仅在感兴趣的细胞中诱导表达,这导致仅在所需组织中进行靶向甲基化。半乳糖调节上游启动子元件(galactose-regulated upstream promoter element, GAL4)是在酵母中发现的转录激活因子,可以与DNA序列中的特殊位点半乳糖上游激活序列(galactose upstream activating sequence, UASG或UAS)结合,诱导UAS下游基因的转录与翻译。
由于primary ORF通常编码荧光蛋白,因此可用于确认所需细胞类型的表达。(达到特异性细胞表达的目的)
图一:TaDa system Gabriel N. Aughey et al. The Company of Biologists Ltd|Development (2019)果蝇中另一种控制Dam表达的是利用FLP重构酶和'FRT'重构位点,该方法结合了一个转录终止子序列,该序列的侧翼序列是FRT 结合位点,该位点被感兴趣细胞中的FLP介导的重组去除。FLP受热更易分解,30 °C为其最适温度,当温度超过39 °C时则基本检测不到活性
FLP/FRT系统首先于酵母体内发现,是一种位点特异性重组系统。FLP重组酶(flippase recombination enzyme)具有位点特异性,FRT是FLP重组酶的特异性结合位点。FLP重组酶可根据两段FRT序列的方向及位置差异而产生不同的基因重组结果(图1B):(1)当两段FRT序列方向一致并在同一条DNA上,FLP可以介导删除FRT序列之间的DNA片段和一个FRT序列,并使被删除的序列成环而丧失转录活性;(2)若FRT序列位于同一条DNA上但方向相反,则FLP会介导FRT序列之间的倒位;(3)若FRT序列位于两条DNA序列上,则FLP介导侧翼序列(flanking sequence)之间的易位。
图二 FLP/FRT 系统 陈轮号, 刘怿君. 黑腹果蝇二元表达系统原理及应用[J]. 生命科学, 2015(5).
图三讲的是,在没有FLP的情况下,在minimal promoter的后面会有一个终止密码子,导致后面的Dam-pol复合蛋白不表达。但是如果有FLP的存在,导致终止密码子被“敲除”。类似于图二中的第一个图,后面的Dam-POI复合蛋白表达。
图三:FLP system Gabriel N. Aughey et al. The Company of Biologists Ltd|Development (2019)
如果在Gal4驱动实验中需要精确的时间控制,则可能需要存在Gal80来抑制Gal4活性。(也就是说把)Gal4/UAS和FLP-FRT系统结合起来。
Mammalian Targeted DamID (MaTaDa)结合了TaDa和Cre-lox系统,去鉴定细胞特异性的染色质互作的动态变化。对细胞量要求更少大于1000-10000个细胞。
之前的Dam用于研究和转录因子结合,和RNA pol II结合
Dam和TF、RNA
二 DamID 探寻染色质状态
chromatin accessibilitu TaDa(CATaDa),一种基于DamID去寻找开放染色质的方法,发表在18年eLife 上 CATaDa reveals global remodelling of chromatin accessibility during stem cell diffe它和利用ATAC-seq和FAIRE-seq得出的结果是一样的。当染色质的结构是开放的话,DNA是松散的,可以被Dam甲基化。通过测序,可以得到染色质开放程度。
CATaDa此外,染色质的开放程度和一些其他的修饰也有关系。比如说组蛋白修饰。在2010年的cell上发表过一篇文章:Systematic protein location mapping reveals five principal chromatin types in Drosophila cells
chromatain type Filion et al., 2010
作者通过DamID和ChIP 的结果,利用PCA分析,得到了5种染色质的状态。检测全基因组上组蛋白修饰特征和核小体重新排列相关的因子的占比,染色质可大致分为对应于活性抑制基因环境的五个离散状态(红色,黄色,绿色,蓝色和黑色)。蓝色和绿色代表异染色质(基本上是沉默的),而黄色和红色染色质与活性基因表达有关。 黑色素代表第三种(也是最普遍的)状态,缺乏传统的异染色质标记物。 这些染色质状态可通过使用代谢蛋白(Brahma,Pol II,HP1,Polycomb等)来确定。通过使用TaDa来确定这些特征蛋白的结合,可以在体内确定多种细胞类型的染色质状态图。
2.1 DamID RNA-染色质的互作状态
长的非编码RNA(lncRNA)是长度超过200bp的转录物,其可以在转录调节中起作用。 许多与转录因子和染色质重塑因子相互作用以影响特定基因组位点的基因表达。RNA-DamID是一种以细胞类型特异性方式鉴定体内lncRNA的新方法。
下面是RNA-DamID 的workfolw ,利用了Gal4-UAS和MCP-MS2这两个系统。从上面往下看。首先在Gal4充足的条件下,Gal4和UAS结合,从而诱导MS2-lncRNA的高表达;与此同时,它还可以诱导Dam-MCP的表达。MCP可以特异性的去结合MS2,所以最后会形成一个lncRNA-Dam的复合物。如果这个lncRNA对基因的表达调控有影响的话。那么那块DNA就会被甲基化。通过测序就可以知道是哪些基因发生了变化。而这种方法比ChART, RAP, ChIRP的灵敏度要高很多。此外,需要的细胞量还少很多。大约30000个
RNA-DamID workflow Cheetham and Brand, 2018
2.2 split DamID
split DamID 可以分析基因组位点上两种蛋白质的co-occupancy。原理:Dam这种酶酶被分成两半,每一半与两种目的蛋白质中的一种融合。 当两种蛋白质非常接近时,Dam会重建并在附近的GATC位点甲基化。
split DamID
2.3 long-range chromatin interactions with DamID
基因的表达有时也会依赖于基于染色质loop的相互作用。在三维空间上非常接近的远距离位点,可以通过将Dam-连接蛋白复合体,然后去探究甲基化情况。 Dam-GAL4 ,该方法已被用于识别同源双胸复合体中形成的染色质环.(Cléard et al., 2006, 2014).
虽然这种方法对于研究染色质的相关实验,但是要求在基因组的特定点引入识别点,所以不太适合复杂遗传生物。合成转录因子,如(TALEs),可以识别任何DNA序列。Dam已经与定制的TALE蛋白融合,以检测小鼠前额叶皮层的长期相互作用的变化。(Mitchell et al., 2016)
long range DNA interactions
三:单细胞发展
3.1 单细胞中的染色质相互作用
几十年来,了解单个细胞的核动力学一直是分子生物学的一个焦点。 2015年完成第一个单细胞中染色质蛋白结合的基因组范围图谱(kind et al., 2015).这项研究确定了核纤层相关蛋白层粘连蛋白B1在单个人类细胞中的结合位点,这突出了细胞间层粘连蛋白相关结构域的可变性。但是这种方法的局限是,不能用Dam-only组作为对照。而且,这个现在的技术瓶颈还存在。
使用限制性内切酶DpnI(结合甲基化GATC,但是不具备内切酶活性)融合的GFP,可在甲基化后立即显示细胞核内的结合位点。此外,细胞内m6A修饰的稳定性可以利用GFP-DpnI 融合蛋白跟踪甲基化位点显示。
3.2 单细胞中的染色质相互作用提高甲基化的分辨率的方法
DamID 的分辨率低(因为只识别GATC motif)现在开发出来了一种DamIP的方法,利用的是一个点突变的DamK9A, 它可以识别ATC序列。ATC序列比GATC在基因上的序列更常见。另一方面,甲基腺嘌呤鉴定(MadID)采用了一种替代腺嘌呤甲基化酶,EcoGII,它已被用于确定层粘连蛋白B1的结合位点。这个酶没有偏好性(不像Dpnl 只识别 GATC)但是,必须得注意m6A抗体拉时候,需要适当的控制以避免脱靶。此外,细胞毒性还不小。
四:summary
DamID等相关技术的有点:1 要求的细胞量比较低,18年Windmer的那篇果蝇的文章,用了2500个细胞
2 对抗体的要求不是很高
3 可以用于特异性的细胞研究
但是缺点也有 4 细胞毒性
5 研究的范围比较小
网友评论