ChIP-seq
实验一般会设置input
作为阴性对照作为背景,这样在做peakcalling
时可以去除噪音得到更真实的IP
结合位点。如果使用macs2
来做callpeak
时,可以生成_treat_pileup.bdg
、_control_lambda.bdg
两个bedgraph
格式的文件,里面分别存储了伪IP
和Input
的信号,为了方便在IGV
里做可视化比较,一般会把bedgraph
转换成bigwig
的格式。为什么说是伪信号呢?关于这个问题的答案在之前的帖子里面做过比较,想知道的可以看戳这里[macs2 | model vs nomdel]。
为了检查IP
实验的富集效果,一般会做一个IP
和Input
在基因周围的信号分布图,如转录因子和一些组蛋白会在基因上游的启动子区域结合,此时就会看到IP
相较于Input
会有一个很高的信号富集。但是,如果IP
效果不好,就会出现一些奇怪的现象,如下图:
![](https://img.haomeiwen.com/i23667126/a7e2d862bd09e187.png)
上面中的Input
信号高于IP
,这个现象就有点奇怪,为什么会这样呢?简单思考一下就会知道,即使IP
没有富集效果也就相当于另一个Input
,信号应该跟Input
本身差不多,为什么会出现Input
高于IP
呢?因为上图是用_treat_pileup.bdg
、_control_lambda.bdg
两个文件的信号做出来的分布。如果了解macs2 callpeak
的工作原理就不难理解,因为这不是真实的信号而是伪信号,尤其是Input
的结果。
下面一段话来自软件的github
,简要描述了callpeak
时参数的选取和统计上是否富集的过程。
For each peak region, MACS calculates the a local lambda for poisson distribution based on the control tags within the 1kb, 5kb and 10kb (1/5/10k are parameters that you can modify) nearby regions to consider the local fluctuations and biases. The local lambda is the maximum of the averages of tags for 1/5/10 kb regions and a whole genome background. Then this local lambda is used to calculate the p-value of poisson distribution. If there is no control data, the ChIP data will be used instead, where the 1kb region is not considered. The fold-enrichment is also calculated using local lambda.
然后,再看看macs2
软件对生成bedgraph
文件的描述,由此可知,_control_lambda.bdg
文件里面存储的是local lambda
值,也就是期望值,并不是真实的reads
信号。
-B, --bdg Whether or not to save extended fragment pileup, and
local lambda tracks (two files) at every bp into a
bedGraph file.
所以,当IP
效果不好时,用macs2
生成的信号文件来展示,便会出现违背印象的结果。当然,即使IP
效果差只要结果有peak
,那咱们可以看peak
区域周边的信号分布,此时IP
信号就会明显富集了,毕竟不富集也不会形成一个peak
。
![](https://img.haomeiwen.com/i23667126/9444b1f0ccf1f0a0.png)
那真实信号分布又是什么样的呢?最真实的信号莫过于bam
里面比对上的reads
,为方便起见可用deeptools
先转换为bigwig
,然后再来看信号分布,如下图就显得比较符合预期了。
![](https://img.haomeiwen.com/i23667126/88db5d896819be2f.png)
这大冬天的写个帖子真不容易,啥时候能去莫吉托喝一杯马尔代夫。。。
往期回顾
常见组蛋白修饰要点汇总
打包2023,迈向2024
ChIPseeker | 详解annotatePeak的三种注释方式
macs2 | model vs nomodel
有些软件总能以某种方式劝退你 | SpectralTAD 之 TAD calling
网友评论