在对bam文件进行排序后,需要去除重复序列,以减少后续分析的计算压力。
sam文件转换为bam文件——SAMtools - 简书 (jianshu.com)
SAMtools——bam文件排序 - 简书 (jianshu.com)
1. 标记重复序列
$ gatk MarkDuplicates -I LPF1_R1_MP.rg.sort.bam -O LPF1_R1_MP.rg.sort.marked.bam -M LPF1_R1_MP.rg.sort.dups.txt
2. 去掉重复序列
picard安装:
picard——修改BAM文件的Read Group - 简书 (jianshu.com)
$ picard MarkDuplicates \
REMOVE_DUPLICATES=true \
I= LPF1_R1_MP.rg.sort.marked.bam \
O= LPF1_R1_MP.rg.sort.dup.bam \
M= out.txt
3.生成索引
$ samtools index LPF1_R1_MP.rg.sort.dup.bam
引用转载请注明出处,如有错误敬请指出。
网友评论