使用GATK进行全基因组数据分析后获得vcf文件,对不同品种变异数据进行特异共有变异位点数据提取
使用工具 BCFtools
bcftools的安装
mamba creat -n bcftools -c bioconda bcftools
激活环境
conda activate bcftools
使用bcftools压缩vcf文件;如不压缩将会报错 not compressed with bgzip
bcftools view file.vcf -Oz -o file.vcf.gz
创建索引
bcftools index file.vcf.gz
提取材料A中特异位点
bcftools isec -C A.vcf.gz B.vcf.gz C.vcf.gz D.vcf.gz -Oz -o A.unique.vcf.gz
参数含义 -C,--complement 输出只存在第一个文件中但在其他们中不存在的变异位点
-O 输出类型 z 输出vcf压缩格式 -o 输出文件名
今天休息一天没去实验室在寝室远程,太卡不写了明天继续
网友评论