从开发而不是使用的角度再看ATAC分析,虽然只是很常见的分析,但是多了一些特殊的感悟


ATAC-seq数据中包含了NFR reads和DNA与核小体结合区域的reads,而ATAC-seq主要关注NFR部分的reads,所以不能直接用所有reads进行Peak Calling。一种方式是把NFR reads单独提取出来进行分析;另一种方式是采用shift-extend的方法进行分析,这种方法尝试对Tn5酶切口的末端平滑化事件进行计数(见下图)。第二种方法更为通用,因为这种方法几乎适用所有为ChIP-seq数据开发的Peak Calling软件,并且不受插入片段大小的影响。(注:不过虽然文献是这么说的,但是如果去读它的那个引文,似乎并没有很清楚的解释为何后者更加通用,如果是前者,可以根据120bp分成两部分)
插入片段大小的理论分布为:NFR fragments(<100 bp)、核小体单体(~200 bp)、核小体二聚体(~400 bp)和核小体三聚体(~600 bp),每个位置上都会有对应的特征性的峰分布
image.png
From reads to insight: a hitchhiker’s guide to ATAC-seq data analysis | Genome Biology | Full Text (biomedcentral.com)
果然全面:ATAC-seq分析流程综述全解企业动态丁香通 (biomart.cn)
网友评论