w因课题需要,采用diamond构建本地nr蛋白库,运行了数小时后得到一个报错,报错信息为Error: Invalid taxonomic rank.
搜索半天没得到解决方法,最终通过微信群中的大佬指点迷津,得以解决。现将具体构建步骤和解决办法记录,以供大家参考。
一、nr数据库及tax信息下载
(1)nr.gz和nr.gz.md5
linux下载方法:wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz*
windows下载方法:Index of /blast/db/FASTA (nih.gov)
下载完成后,使用如下命令检查nr.gz的完整性
md5sum -c nr.gz.md5
(2)prot.accession2taxid.gz和taxdump.tar.gz下载(注意和nr)
wget -c https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz*
wget -c https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz*
diamond下载
二、建库
diamond makedb --in nr.gz --db nr --taxonmap prot.accession2taxid.gz --taxonnodes nodes.dmp
其中nodes.dmp来自taxdump.tar.gz
报错:
Error: Invalid taxonomic rank.
解决办法:
更新diamond版本,原来diamond为0.9.3.1,更新为v2.0.15得以解决。
下载链接为https://github.com/bbuchfink/diamond/releases/(请务必下载与taxdump相匹配的版本)
网友评论