一、计算每个SNP缺失频率
vcftools --vcf Bra.snp.filter.pass.all.bol.really.vcf --missing-site --out SNP_missing
获得的SNP_missing结果,最后一栏为缺失率:
image.png
二、过滤掉缺失率大于10%和非bi-allelic 基因
python ../bin/snp_filter_by_miss_bi-gene.py SNP_missing.lmiss snp.vcf snp.filter_by_miss_bi.vcf
三、第二种简单的方法
#过滤掉缺失率大于10%和非bi-allelic 基因
vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --min-alleles 2 --max-alleles 2 ---recode -out SNP
#直接vcftools过滤和转换成plink格式,在转换过程中自动的只保留了 bi-allelic 位点。
vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --plink --out SNP
网友评论