参考:https://www.likecs.com/show-204987447.html?sc=400
https://cloud.tencent.com/developer/article/1346057

1、narrow peaks format
BED6+4格式,列数10列
#我callpeak的时候,是没有加参数,默认为narrow,输出的文件就是narrowpeak文件
在做call peak的时候,有个设置宽峰窄峰的参数,这个有两种判断标准。
第一种常规:组蛋白通常用board,转录因子通常用narrow。narrowpeak相对更容易被检测到
第二种看帮助文档:对reads数有要求。

“broad” histone marks, such as H3 lysine 27 trimethylation (H3K27me3), H3 lysine 36 trimethylation (H3K36me3), or H3 lysine 79 dimethylation (H3K79me2) can spread over larger genomic regions of several hundred kilobases。While TFs usually occupy genomic regions of a few hundred bp or less [19], histone marks with “sharp” peaks, such as histone H3 lysine 27 acetylation (H3K27ac), H3 lysine 9 acetylation (H3K9ac), or H3 lysine 4 trimethylation (H3K4me3), represent regions covering up to a few kilobases

前四列分别代表chrom, chromStart, chromEnd, name, 用于描述peak区间和名称,注意bed格式中起始位置从0开始计数。第五列代表score,在macs2的输出结果中为int(-10*log10qvalue),第六列代表strand, 在macs2的输出结果中为.,第七列代表signalvalue, 通常使用fold_enrichment的值,第八列代表pvalue, 在macs2的输出结果中为-log10(pvalue),第九列代表qvalue, 在macs2的输出结果中为-log10(qvalue),第十列代表peak, 在macs2的输出结果中为peak的中心,即summit距离peak起始位置的距离。

# Broad Peaks Format这个应该是设置宽峰参数才有的吧
这种格式就是在narrow peaks format的基础上丢掉了最后一列的信息,为BED6+3的格式, 列数为9列。
2、call peak还会输出xls文件
NAME_peaks.xls

包含peak信息的tab分割的文件,前几行会显示callpeak时的命令。输出信息包含:
染色体号、peak起始位点、peak结束位点、peak区域长度、peak的峰值位点(summit position)
peak 峰值的高度(pileup height at peak summit, -log10(pvalue) for the peak summit)
peak的富集倍数(相对于random Poisson distribution with local lambda)
!!!!!Coordinates in XLS is 1-based which is different with BED format
XLS里的坐标和bed格式的坐标还不一样,起始坐标需要减1才与narrowPeak的起始坐标一样。
3、bedgraph格式
callpeak加了-B参数会有两个文件,以导入UCSC或者转换为bigwig格式。两种bfg文件:treat_pileup, and control_lambda.我感觉啊!!是为了转bw用来可视化的
4、NAME_summits.bed
BED格式的文件,包含peak的summits位置,第5列是-log10pvalue。如果想找motif,推荐使用此文件。
网友评论