有的时候在做数据分析的时候,会用到各种各样的分析软件,而每个分析软件又有与之相匹配的输入文件格式。格式不对,会很麻烦,有时候会出现错误的结果,甚至就不能运行程序。而许多软件之间的文件格式是可以相互转化的。直接转化就可以方便很多。今天就来讲一讲plink的ped和map文件与vcf文件的相互转化。因为在许多情况下这两种文件格式是需要转化的。
首先介绍一下由plink转vcf
plink --file test --make-bed --out test_1 ###此步是将map和ped文件转换为二进制的文件
plink --bfile test_1 --recode vcf-iid --out test_vcf ###这样就把plink文件转换成vcf格式了(很简单吧!)
然后在介绍一下将vcf格式文件转化为plink格式文件
这个需要下载一个软件vcftools,应该是基于linux系统的,windows版本的好像没有(我一直用linux版本的,windows我没有找到)。https://jaist.dl.sourceforge.net/project/vcftools/vcftools_0.1.13.tar.gz(进入这个网址就可以下载vcftools了),我认为vcftools是一个很有用的软件,比如他还可以计算遗传分化指数(Fst)等。好了闲话少说,回归正题。
vcftools --vcf xx.vcf --plink --out xx
哈哈,这个比上面的还要简单吧。真的说不清楚,有时候程序和软件真的很奇妙。
网友评论