step1:conda创建vep环境,安装vep
conda create -n vep #创建环境
conda install -c bioconda ensembl-vep -y #安装vep
conda activate vep #激活vep环境
step2:安装完vep,可以使用其他功能,但是在用gff文件作为注释源的时候,发现少了perl模块Bio::DB::HTS::Tabix,这时我们也可以使用conda来安装这个模块
conda install -c bioconda perl-bio-db-hts
step3:安装完这个库之后,在注释的时候,发现提示我另一个库的调用是有问题的,我猜测是版本问题,所以修改了我的环境变量,将vep下的perlib作为perl的唯一模块库,避免调用之前安装的库,导致版本冲突

step4:修改gff注释文件,使其满足vep的注释格式要求(sort by chrome and index it)
grep -v "#" data.gff | sort -k1,1 -k4,4n -k5,5n -t$'\t' | bgzip -c > data.gff.gz
tabix -p gff data.gff.gz
./vep -i input.vcf --gff data.gff.gz --fasta genome.fa.gz
这样就完成了。
注:有时候会遇到无法识别的基因feature type,比如miRNA,他会报错,这时候,将gff文件中的这一类型删除就可以,再重复step4,新做一个gff文件
网友评论