美文网首页群体遗传学
基因组变异分析GATK4实战演练(1)-导入

基因组变异分析GATK4实战演练(1)-导入

作者: Jason数据分析生信教室 | 来源:发表于2020-11-28 13:51 被阅读0次

    前言

    使用真实数据,从零开始进行短序列的WGS分析。只要跟着本文的管道走,就一定可以轻松重复GATK4的分析结果。当然如果读者有自己的数据,只需改变数据文件名,也可以自己轻松做WGS分析,从此再也不需要求人。类似本文一个完整的分析淘宝上的价格是2000-3000人民币。

    1. 课题

    你手上有一个人的外显子基因组数据,使用GATK4进行分析,你可以得出哪些发现。

    2. 目的

    对一个外行或者刚入门的小白来说看起来很简单,"查一下基因数据不就好了"。Oh, really?! 真的这么简单的吗,做一下基因对比就真的可以发现什么问题吗?我们可以通过这个教程来实践验证一下。

    3. 操作流程

    1. Mapping 比对与拼接
      a. 准备好参照序列
      b. 准备好工具,这里我们会用BWA
      c. 准备好样本的短序列数据,演练会提供真实数据的下载链接。
      d. 进行Mapping
    2. 变异检测
      a. 去除PCR重复
      b. 变异检测
    3. 变异基因的注释
    4. 和疫病有关的基因的提取和注释
      a. 一共有多少位置产生了变异?
      b. 需要考虑到样本的性别,毕竟XY和XX不同
      c. 通过耳垢的干湿类型有关的SNP来判断本次样本的耳垢干湿类型
      我们的结果会得到一个VCF文件,里面包含了所有SNP的信息。VCF里比较重要的信息如下列出

    GT: Genome Type 基因型
    AD: Allele Depth 每一种allele的reads覆盖度
    DP: Depth 深度
    GQ: Genome Type Score 99分为满分
    PL: 0/0, 0/1, 1/1各个基因型的尤度, 三个值加起来的和应该是1,数值越小,可能性越低。

    具体的分析管道会在后续的文章里详细说明。

    相关文章

      网友评论

        本文标题:基因组变异分析GATK4实战演练(1)-导入

        本文链接:https://www.haomeiwen.com/subject/yanrvktx.html