染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。
将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。
ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。
chip-seq 实战就跟在转录组和外显子上的实战是没有本质区别的,只是它多了一些分析,转录组只找表达量做差异分析,外显子只找变异做变异注释,那chip-seq 找的是peaks和motif 。
转录因子(Transcription Factors, TFs)是指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子与特异性DNA结合通常概括为“基序”(motif)
ChIP-seq实验的基本步骤包括:
-
通过甲醛使靶蛋白与染色质上目标区域的DNA交联结合
-
通过超声或酶解的方法将染色质破碎成小片段( 一般200-600bp合适)
-
使用特定抗体与靶蛋白结合富集目标区域的DNA(抗体的选择很关键哦~)
-
使靶蛋白与染色质上目标区域的DNA解交联,达到纯化DNA的目的
-
通过PCR或者是qPCR检测目标区域的DNA是否被靶蛋白富集到,然后再进行测序分析。
ChIP-seq的分析流程:
懒,没有整理成电子版的,字丑请自动忽略怎样识别富集区域?
从DNA测序的角度来说,因为测序都是5'端的reads,对于一个DNA序列来说(有正负链的),它mapping的位置正负链都有的(也就是红色和蓝色的reads都有),对这些reads位置进行统计画图可以看到一个红色的peak,一个蓝色的peak。这两个peak说明的是一个事情,就是这个地方有富集。最后对这两个peak进行merge,最后变成了一个富集区域。灰色的peak!
image.png
ChIP-seq的常见峰型
不同类型的蛋白或者组蛋白修饰会得到不同的峰形。三种主要数据分布类型:
sharp binding sites, CTCF (red);
a mixture of shapes, RNA Polymerase II (orange);
medium size, H3K36me3 (green);
large domains, H3K27me3 (blue)
ChIP-seq的不同峰
富集倍数
一般来说富集倍数要在5以上才算是显著,如何计算富集比率呢?看图~
富集比率计算部分参考资料来自:https://www.jianshu.com/p/87bc2002e82c
感谢这位老铁对我的帮助,好人一生平安。
网友评论