美文网首页
GATK学习笔记

GATK学习笔记

作者: 浩瀚之宇 | 来源:发表于2018-11-16 14:15 被阅读0次
  1. BaseRecalibrator
    该GATK模块用来检测碱基质量分数中的系统错误。由于原始数据中可能存在一些测序仪器产生的系统性误差,那么变异位点识别过程中找到的变异位点就会存在假阳性的位点。该程序利用机器学习的方式调整原始碱基的质量分数, 即为碱基质量分数重校准(Base quality score recalibration,BQSR)。该模块的分析过程分为两个步骤: 1)利用已有的snp数据库,建立相关性模型,产生重校准表( recalibration table);2) 根据这个模型对原始碱基进行调整,仅调整非已知SNP区域。

输入

需要重校准的BAM文件
已知的多态性位点数据库,用于屏蔽那些不需要重校准的部分

输出

GATK可能会报告许多表格:

参数列表
量化质量表
每个read gruop的重校准表
按质量得分的重校准表
所有可选协变量的重校准表
gatk --java-options "-Xmx20G -Djava.io.tmpdir=./" BaseRecalibrator -R $ref -I ${sample}_marked_fixed.bam --known-sites $snp --known-sites $indel -O ${sample}_recal.table 1>${sample}_log.recal 2>&1 

参考
https://software.broadinstitute.org/gatk/documentation/
https://www.jianshu.com/p/0e6162104294

相关文章

  • GATK学习笔记

    BaseRecalibrator该GATK模块用来检测碱基质量分数中的系统错误。由于原始数据中可能存在一些测序仪器...

  • GATK的初次了解

    终于讲完了Journal club,可以踏实下来继续学习生信知识啦~ 这篇学习笔记主要是对GATK有一个初步了解,...

  • 学习笔记:GATK call snp

    需要的数据文件:ref.fa test_1.fq test_2.fq 测序数据质控(具体方法另做总结),由原始测序...

  • GATK 学习

    本文学习GATK4.0和全基因组数据分析实践 1. 项目目录结构 2.下载E.coli K12的参考基因组序列 3...

  • GATK官网学习笔记Data pre-processing fo

    这篇笔记是对GATK官网上发布的寻找突变体之前的数据预处理这一块内容的学习笔记。实际上也是一篇翻译笔记。原文在这里...

  • GATK Best Practices — step0 写在前面

    这一步是对GATK4 Best Practices的学习的一些准备。 一、GATK4 Best Practices...

  • 安装GATK4

    下载安装GATK 下载GATK4 https://software.broadinstitute.org/gatk...

  • Broad Institute视频笔记Run Haplotype

    上一篇笔记里练习了如何使用WDL+Cromwell来打印hello world。这篇笔记就来练习一下运行GATK的...

  • GATK4测试学习

    Getting-started-with-GATK4 GATK代表GenomeAnalysisToolkit。 它...

  • 用conda下载安装gatk3.8并注册

    现在gatk已经更新到gatk4了,但是gatk3.8还是有很多应用的场景,比如指定多线程,并且有些功能在gatk...

网友评论

      本文标题:GATK学习笔记

      本文链接:https://www.haomeiwen.com/subject/vpkmfqtx.html