美文网首页群体遗传学
GATK4 SelectVariants ——vcf文件提取SN

GATK4 SelectVariants ——vcf文件提取SN

作者: Wei_Sun | 来源:发表于2022-02-11 00:16 被阅读0次

    在生成raw vcf后,进行SNP和indel提取,便于后续分析。
    GATK4——gVCF转VCF - 简书 (jianshu.com)

    输入文件:

    • 参考基因组
    • vcf文件

    1. 提取SNP

    $ gatk SelectVariants \
            -R ~/ref/Mparg_v2.0.fa \
            -V LPF1_MP.vcf.gz \
            -selectType SNP \
            -o LPF1_MP_raw_snps.vcf
    

    报错:A USER ERROR has occurred: -selectType is not a recognized option

    查了一下资料,不同版本的gatk提取SNP和indel的命令不同。

    各版本GATK的说明书,大家可以根据自己的GATK的版本查看命令:
    https://gatk.broadinstitute.org/hc/en-us/categories/360002369672-Tool-Index

    修改如下:

    $ gatk SelectVariants \
         -R ~/ref/Mparg_v2.0.fa \
         -V LPF1_MP.vcf.gz \
         --select-type-to-include SNP \
         -O PF1_MP_raw_snps.vcf
    

    2. 提取indel

    $ gatk SelectVariants \
         -R ~/ref/Mparg_v2.0.fa \
         -V LPF1_MP.vcf.gz \
         --select-type-to-include INDEL \
         -O LPF1_MP_raw_indel.vcf
    

    参考材料:
    https://gatk.broadinstitute.org/hc/en-us/articles/4404604678299-SelectVariants

    引用转载请注明出处,如有错误敬请指出。

    相关文章

      网友评论

        本文标题:GATK4 SelectVariants ——vcf文件提取SN

        本文链接:https://www.haomeiwen.com/subject/vgagkrtx.html