用vcf2maf
批量把vcf转化成maf文件,使用的是本人写的pipeline
,会自动记录哪些步骤已run
,中断后重新开始不需要再run
。
通过多进程方法,能同时运行多个pipeline
,还能提示一个步骤运行了多少时间。
因为挂新硬盘的原因,关机挂载硬盘,转移数据,重新运行脚本,按理说在关机前被中断的5个vcf2maf
过程会重新开始,然而发现这5个vcf2maf
的时间显著低于前面样本同步骤,且生成的maf大小明显偏低。
关机,挂硬盘折腾了一番,仍然如此,头大。
后来想着干脆全部样本重新跑试试 ,作备份时,把待转的vcf文件目录下,在vcf2maf
过程中由vep
生成的vep.vcf文件全部转移掉,再怀着试一试的想法重新运行vcf2maf
,发现时间应该正常了!!
猜想:可能是vcf2maf
调用 vep
前,如果检测到同目录下有vcf
文件对应的vep.vcf
文件,就认为已经完成vep
注释过程,vcf2maf
会直接从vep.vcf
文件转成maf
文件。起初被中断的5个样本,并没有完成相应的vep
注释就直接进入生成maf
过程,从而出现一开始描述的问题。
解决方法:及时把生成的vep.vcf文件转移或删除
网友评论