美文网首页
2021-04-22 bam文件中提取比对(mapped)或未比

2021-04-22 bam文件中提取比对(mapped)或未比

作者: AsuraPrince | 来源:发表于2021-04-22 17:15 被阅读0次

flags

1 0x1 这序列是PE双端测序

2 0x2 这序列和参考序列完全匹配,没有错配和缺失

4 0x4 这序列没有mapping到参考序列上

8 0x8 这序列的mate序列没有mapping到参考序列上

16 0x10 这序列比对到参考序列的负链上

32 0x20 这序列的mate序列比对到参考序列的负链上

64 0x40 这序列是read1

128 0x80 这序列是read2

256 0x100 这序列不是主要的比对,因为序列可能比对到参考序列的多个位置上

512 0x200 这序列没有通过QC

1024 0x400 这序列是PCR重复序列

2048 0x800 这序列是补充比对

1.查看

其中bam文件中用标签4代表read未比对上;所以查看未比对上的reads用

samtools view -f 4 *bam|less -S

2.提取

提取未比对到参考序列的结果:

samtools view -b -h -f 4 *.bam > unmapped.bam

-h 文件包含header line;-f,提取;-b,输出为bam格式

###-F参数是过滤的意思(filter);这里类似grep -v

所以提取比对到参考序列的结果:

samtools view -b -h -F 4 *.bam > mapped.bam

F意思为过滤掉以4为标签的序列

提取双端序列都比对到参考序列(4+8)的结果

samtools view -bF 12 *.bam > mapped.bam

3.bam2fastq

bamToFastq -bam file_unmapped.bam -fq1 unmappedR1.fastq -fq2 unmappedR2.fastq

参考文献:http://blog.sina.com.cn/s/blog_9fe4fc830102x7s6.html

https://www.cnblogs.com/leezx/p/8655086.html

相关文章

网友评论

      本文标题:2021-04-22 bam文件中提取比对(mapped)或未比

      本文链接:https://www.haomeiwen.com/subject/bddfrltx.html