bedtools shuffle
的目的是保持每个 interval 的总长,随机变换所有 inerval 的位置,结果可以作为一种随机背景。-chrom
参数将随机重分配限定在原来的染色体上,可能有助于一些原本就在各个染色体上分布有差异的样本得到更「公正」的结果,或换言之更关注每条染色体之间的差异,然:
对一堆 ChIP-seq peak bed 文件一通操作:bedtools shuffle -chrom
发现很多 bed 文件在各种 variant 上产生了 start
和 end
都为负的情况,之前也有人发现了这个问题 Bedtools shuffle produces gibberish when using -chrom #663 .
应该是由于 bed 文件和 基因组文件中染色体名称不同,当然是各种变体的名称
随便看一个 ChIP-seq bed 文件:
image基因组文件:
image所以,最终的解决办法就是,只保留 canonical 的染色体,或者不用 -chrom
这个参数。
最后,更希望有人点击我的绿鸟网站页面...
网友评论