美文网首页gatk报错原...
gatk4 MarkDuplicates后出现:MATE_NOT

gatk4 MarkDuplicates后出现:MATE_NOT

作者: 二傻吧 | 来源:发表于2020-02-24 15:33 被阅读0次

gatk4 MarkDuplicates

java -jar picard.jar MarkDuplicates \
      I=input.bam \
      O=marked_duplicates.bam \
      M=marked_dup_metrics.txt

问题记录:

在此步结束之后,会有metrics.txt生成,metrics.txt中的内容讲解可见metric

gatk4 ValidateSamFile

java -jar /software/picard-tools-1/picard-tools-1.103/ValidateSamFile.jar

问题记录:

在检验831panel中的去重之后的BAM文件时出现以下错误:(mode为VERBOSE)

注:用FixMateInformation对去重之后的BAM进行修正后,依然出现这种问题。

image.png

后又用SUMMARY模式重新跑,看到以下结果:

image.png

嗯,有27876个read 丢失了meta。但是去重的前一步验证BAM时是一切正常的,然后查看了MarkDuplicates的metrics文件,发现以下结果:

image.png

原因找到了,因为这27876个read被标记过滤了。所以,是因为,这么多read被过滤了,留下的bam中就有这么多的read找不到他们的meta了。

unpaired read可以这么理解:which did not have a mapped mate pair, either because the read is unpaired, or the read is paired to an unmapped mate.所以这里出现的应该是第二种可能: the read is paired to an unmapped mate。

image.png

相关文章

网友评论

    本文标题:gatk4 MarkDuplicates后出现:MATE_NOT

    本文链接:https://www.haomeiwen.com/subject/qapvqhtx.html