简单说明:
- 从2.28.0版开始,bedtools使用htslib库支持CRAM格式
- 除了BAM文件,bedtools默认所有的输入文件都以TAB键分割
- 除非使用-sorted选项,bedtools默认不支持大于512M的染色体
- 如果没有使用-sorted参数对染色体按编码顺序进行排序(e.g., sort -k1,1 -k2,2n ),则必须使用-g参数输入相同排序染色体
- bedtools要求染色体命名方案在比较文件中是相同的(例如‘chr1’和‘1’不能同时存在)
1 genomecov
计算基因组水平上的reads覆盖度,可以以单个点位显示(-d),或者以bed格式显示(-bg)。
在运行之前,保证
(1) 输入的bed/vcf/gff 文件时,要对齐进行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 输入ban文件时,使用ibam 参数,先对bam文件进行sort,可不加-g 参数
如下
bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1 0 183326 0
YYchr1 183326 183590 1
YYchr1 183590 187919 0
YYchr1 187919 188138 1
YYchr1 188138 190127 0
YYchr1 190127 190272 1
YYchr1 190272 190354 0
# -bg: 以bed文件输入
# -bga: 如上一样,但同时输入覆盖度为0的区域
以上结果中,第一列染色体,2,3列,位置区域,第4列 coverage,该区域的定义如下所示
![](https://img.haomeiwen.com/i19633912/7c4a88b0be908bc6.png)
网友评论