美文网首页
10.15 GATK2 变异的质控

10.15 GATK2 变异的质控

作者: KK_f2d5 | 来源:发表于2018-10-15 16:58 被阅读0次

    硬过滤其实就是通过人为设定一个或者若干个指标阈值(也可以叫数据特征值),然后把所有不满足阈值的变异位点采用一刀切掉的方法。

    可以直接使用GATK VQSR所用的指标——毕竟这些指标都是经过精挑细选的。

    QualByDepth(QD)

    FisherStrand (FS)

    StrandOddsRatio (SOR)

    RMSMappingQuality (MQ)

    MappingQualityRankSumTest (MQRankSum)

    ReadPosRankSumTest (ReadPosRankSum)

    snp indel 硬过滤

    合并snp indel 过滤文件
    time $gatk MergeVcfs \

         -I out/${sample}.HC.snp.filter.vcf.gz out/${sample}.HC.indel.filter.vcf.gz \

         -O out/${sample}.HC.filter.vcf.gz

    符合filter-expression会被过滤掉,留下的视为正常变异。


    https://www.jianshu.com/p/ff8204ae7ebf

    所以,上面的阈值都是NA12878(来自GIAB)的高深度数据得到的。如果是其他物种,可以用类似方法找。

    还有snpEFF注释和IGV可视化等。

    相关文章

      网友评论

          本文标题:10.15 GATK2 变异的质控

          本文链接:https://www.haomeiwen.com/subject/geaxzftx.html