写在前面。
nr.*tar.gz # Non-redundant protein sequences from GenPept, Swissprot, PIR, PDF, PDB, and NCBI RefSeq
nt.*tar.gz # Partially non-redundant nucleotide sequences from all traditional divisions of GenBank, EMBL, and DDBJ excluding GSS,STS, PAT, EST, HTG, and WGS.
----http://www.cnblogs.com/leezx/p/6425620.html?utm_source=itdadao&utm_medium=referral
1.下载nr,nt包
nohup gunzip nr &
nohup gunzip nt &
- md5值校验文件完整性。两个包一个27GB,另外一个35GB,也不算小,用md5值校验,安心。
md5sum nr.gz
md5sum nt.gz
[root@xxx nr_nt]# md5sum nr.gz
f17f681c860d0c5d85342088f0818713 nr.gz
[root@xxx nr_nt]# cat nr.gz.md5
f17f681c860d0c5d85342088f0818713 nr.gz
[root@xxx nr_nt]# md5sum nt.gz
5d50c089a686f771d164c9e8e9a81a12 nt.gz
[root@xxx nr_nt]# cat nt.gz.md5
5d50c089a686f771d164c9e8e9a81a12 nt.gz
- 校验结果与上述下载的两个md5文件比较。
2.本地建库.
- 建立索引步骤放在后台运行,考虑避免建库出现错误,添加了 -logfile 函数,记录建库的过程。
nr本地化
nohup makeblastdb -in nr -parse_seqids -hash_index -dbtype prot -logfile nr_logfile &
- nt本地化
nohup makeblastdb -in nt -parse_seqids -hash_index -dbtype nucl -logfile nt_logfile &
yuwq
2017/4/17
现在看当年写的教程,还是太年轻了。最大的问题就是权限。我怎么能直接在root账户下做这些操作,危险系数太高了。
sudo是个好东西,只是当时没有意识到!
另外一个就是不能什么东西都一股脑用nohup丢到后台,用2>&1 > file.log
这种方式 保存更利于后面到排错。
yuwq
2019/7/9
网友评论