美文网首页生信
vcftools过滤SNP数据2021-02-25

vcftools过滤SNP数据2021-02-25

作者: candel | 来源:发表于2021-03-02 08:48 被阅读0次

    一、计算每个SNP缺失频率

     vcftools --vcf Bra.snp.filter.pass.all.bol.really.vcf --missing-site --out SNP_missing
    

    获得的SNP_missing结果,最后一栏为缺失率:


    image.png

    二、过滤掉缺失率大于10%和非bi-allelic 基因

    python ../bin/snp_filter_by_miss_bi-gene.py SNP_missing.lmiss  snp.vcf  snp.filter_by_miss_bi.vcf
    

    三、第二种简单的方法

    #过滤掉缺失率大于10%和非bi-allelic 基因
    vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9  --min-alleles 2 --max-alleles 2 ---recode -out  SNP
    #直接vcftools过滤和转换成plink格式,在转换过程中自动的只保留了 bi-allelic 位点。
    vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --plink --out  SNP
    

    参考:
    http://vcftools.sourceforge.net/man_0112a.html

    相关文章

      网友评论

        本文标题:vcftools过滤SNP数据2021-02-25

        本文链接:https://www.haomeiwen.com/subject/xofpfltx.html