写在前面的废话
这篇文章来自于一个舔狗的悲哀,谨以此文告诉大家莫当舔狗……
image.png
以上聊天记录,就是整个故事背景。当时我的内心历程:
- 我看过类似的文章欸,赶紧发出来展现一下我的阅读量,说不定可以被夸
- 怎么回事?怎么和我想得不一样,没有被夸就算了,咋还安排了一个journal?
好了,废话这么多,进入正题吧
太长不看系列
- coBATCH方法大体上与CUT&Tag使用的方法保持一致,但是略有不同
- 都具有信号高,背景噪音低的优点
废话超多系列
ChIP-seq方法可以为我们揭示细胞的表观组信息,但是这个方法有一些缺点,比如信号低,背景噪音高,细胞所需的起始量较高等……为了解决这些问题,单细胞ChIP-seq方法应运而生。接下来,我将比较最近的两个单细胞ChIP-seq方法。
CUT&Tag方法
这篇文章于今年4月份由Henikoff实验室发表,以下简称为CUT&Tag方法
image.png实验操作
下图是该方法的具体工作流程:
image.png
- 第一步先对细胞进行透化
- 透化后的细胞使用特异性抗体结合(此抗体可以是任何我们所需要的表观修饰的抗体)
- 加入二抗,此处加入二抗的目的是为了增加后续proteinA-Tn5结合的位点
- 加入proteinA-Tn5融合蛋白。proteinA 提供了特异性结合抗体的能力,而Tn5由于其自身的cut&paste能力,可以对目标序列片段化并加上adapter
- 加入Me2+离子,激活反应
- 对于加上adapter的序列进行PCR扩增并上机测序
方法验证
接下来就是一系列的常规操作了,首先讲一下这个方法如何的好,之前的方法如何的不好,再与之前的方法相比一下,该方法的优点在哪里……
image.png如果时间充足,可以详细看看此处文章是如何优缺点的,如果时间不足,建议直接跳到CoBATCH方法部分
以下讲解都是图在上,具体内容在下,谨慎食用
- 比较传统ChIP-seq不同测序深度时的信噪比,发现50M reads有更高的信噪比,背景噪音较低。
- 比较相同测序深度的CUT&Tag方法,ChIP-seq方法以及CUT&RUN方法(另一种ChIP方法,依赖于MNase-proteinA融合蛋白,该方法需要人工加接头)。明显能看到CUT&Tag方法和CUT&RUN方法有更高的信噪比
- 比较CUT&Tag方法对于不同组蛋白修饰的测序结果,发现不仅是K27me3,K4me1和K4me2也具有很高的信噪比
- 文章使用一个非特异性的抗体作为阴性对照,发现信号大都很弥散,符合预期
- 此外,作者还使用了ATAC-seq技术分析染色质开放区域,发现K4me2与ATAC-seq信号区域有很高的重合率,并在后续分析中绘制Metaplot以及heatmap进一步验证结果(此处未放图)。最终结果表明H3K4me2对于染色质开放区域的捕获具有很高的灵敏性。
- 除了组蛋白修饰,文章还对RNA PolⅡ进行了分析,得到了相似的结果
image.png此处使用的是K562细胞,为了验证该方法对于细胞类型不具有特异性,对H1 ES 细胞也进行过了上述分析,并得到了相似的结果
除了对组蛋白修饰以及RNA聚合酶Ⅱ的分析,作者还对转录因子的效力做了进一步验证。
- NPAT是一个组蛋白基因复制依赖的转录共激活因子,结合在chr1和chr6上大约80个位点
- 作者对结合位点进行分析后发现,有一部分信号落在了基因组的开放区域。这一部分信号,作者认为很有可能是由于proteinA-Tn5非特异性结合所导致。
- 不过作者通过分析不同信号的测序深度,可以有效地将转录因子结合位点信号与ATAC site位点信号分离。
- 由于NPAT的结合位点较少,作者进一步分析了CTCF protein的结合位点信号,并得到了相似的结果
image.png此处有一个比较有意思的地方,从正常的角度来看,上述所说的proteinA-Tn5的非特异性结合应该属于一个缺点。但是,作者却反其道而行之,认为该方法在检测转录因子结合位点信号的同时,还可以检测染色体开放区域的信号。所以说,写作技巧和思维真的很重要啊,小伙伴们
说了这么多,那究竟如何做到单细胞程度呢?如上图所示该方法将细胞分选到一个板子里,保证给板子里的每一个孔都只有一个细胞。这样每个小孔里都加入携带有不同index的proteinA-Tn5,这样就保证了我们后续可以将不同细胞来源的DNA片段分离。
该方法需要借助单细胞ATAC-seq的分选装置,目前已在SMARTer system中测试过,作者认为10X的装置也可以应用于该方法。作者将单细胞的信号累加后与bulk信号相比,发现信号分布程度基本相似。
image.png接下来作者分析了该方法究竟能不能区分细胞的类型。首先使用Fraction of reads绘制小提琴图,我们可以清楚的看到不同类型的细胞,其分布显著不同。此外,作者还选取了几个基因位点,发现利用一些特定基因位点的信号分布也可以区分细胞类型。
优缺点总结
优点 | 缺点 |
---|---|
耗时短(10h) | 需要特殊装置进行细胞分选 |
背景噪音低 | |
信号水平高 | |
fraction of reads in peak(FRiP)高 | |
可以在细胞内原位反应 | |
检测转录因子信号的同时可以检测染色质开放区域 | proteinA-Tn5存在少量非特异性的结合 |
FRiP可以简单的理解为特异性
CoBATCH方法
这篇文章于今年8月份由何爱彬实验室发表,以下简称为CUT&Tag方法。该方法的大致流程与CUT&Tag方法相似,只是在加标签的步骤略有不同
image.png该方法对细胞进行了两次分选,第一次保证板子里的每个小孔只含有200-250个细胞,此时加入proteinA-Tn5,携带有T5/T7标签。在反应结束后将细胞再次分布,保证板子里的每个小孔只含有20-25个细胞。此时加入含有i5/i7的标签。
最终,我们得到的每个细胞DNA,都含有两个不同的index,保证细胞有不同的index组合(此处小声逼逼,作者此处分析发现大概有7%的细胞可能有相同的index组合,并认为7%很低,我个人觉得这个比例还是蛮高的)
接下来就是和CUT&Tag文章相同的操作了,方法优劣的比较以及该方法的具体应用。因为不做单细胞,所以对于其应用中的具体操作就不在这里介绍了。
方法比较
对上述两种方法做一个简单的比较,个人见解,欢迎大家指正:
CUT&Tag | CoBATCH |
---|---|
一抗孵育一次,二孵育一次 | 只用抗体孵育了一次 |
分选一次 | 分选两次 |
每个小孔中只有一个细胞 | 第一次分选:小孔中有200-250个细胞;第二次分选:20-25个细胞 |
没有index重合 | index重合率为7% |
需要借助特殊装置分选细胞 | 文章未声明,也许不需要使得实验操作更加平民化 |
总之,要想更准确,推荐第一种方法;要想操作简便,推荐第二种方法
一点题外话
大家或多或少都会使用R进行数据分析,而其中的bioconductor又是我们躲不掉的阻碍。因此想在这里问问大家,是否愿意从头开始学bioconductor,而不仅仅是简单的对代码复制粘贴。比如,GRanges对象,biomaRt的使用等……
如果你觉得我的提议不错,请点击一下在看
或者后台留言~
网友评论