美文网首页
2021-03-31 为VCF文件建立索引(.idx)

2021-03-31 为VCF文件建立索引(.idx)

作者: AsuraPrince | 来源:发表于2021-03-31 20:18 被阅读0次

    问题背景:

    做GWAS分析,对方只提供了具有SNP和indel的vcf文件,需要提取SNP时,提取时去发现,需要对应的索引(.idx)

    这种情况下可否不去要求对方提供.idx文件,生成一个新的进行分析?

    通过网上查询发现通过bcftools和GATK都可以生成。

    1.尝试bcftools(参考文献:https://www.cnblogs.com/xiaofeiIDO/p/8294998.html ;bcftools 为 vcf 文件建索引及合并 vcf 文件)

    通过conda安装bcftools;然后尝试bcftools,发现无法用bcftools,原因是缺相(libcrypto.so.1.0.0,真他妈心碎,旧问题没解决出现新的问题!!!报错如图)

    尝试寻找,解决方法(1.https://blog.csdn.net/u012000056/article/details/52671474 ;libssl1.0.0或者libcrypto.so.1.0.0库的问题解决方法 2. https://www.jianshu.com/p/e7d472375574 (没看明白放弃))

    1.方法:需要安装libssl1.0.0;conda不给力、而且部分用户是因为ssh不行出现这个问题(https://blog.csdn.net/zhengxiuchen86/article/details/105611158),难道这个会影响shh,目测可能会造成更大问题,搞不好的话。所以放弃了!!!!

    2.尝试GATK建立索引。

    但是怎么用不知道,可以肯定的是借助IndexFeatureFile命令;有些网上说是用gatk IndexFeatureFile -F variant.vcf (https://www.jianshu.com/p/a3b3c6190d35),但是参数不识别报错;有些说用$java -jar $gatk IndexFeatureFile --feature-file $dbSNP_vcf (https://zhuanlan.zhihu.com/p/70763177),哈哈哈也不行,参数不识别;报错提示用input??用input可以运行了。皆大欢喜!(最后命令为:gatk IndexFeatureFile -I XXX.vcf).

    参数应用各个人都不一样或许是软件不断更新的缘故!!!但是就是总结的话,就是别乱找网上的问题,好好看看报错,解决不了,在满世界找!(好像也有一个人用对了命令,但是遇到了其他问题,https://www.omicsclass.com/question/2229,不能幸免这个问题,我也遇到了;都是坑啊)

    相关文章

      网友评论

          本文标题:2021-03-31 为VCF文件建立索引(.idx)

          本文链接:https://www.haomeiwen.com/subject/rpuahltx.html