美文网首页
生信常用数据库(二):NT 数据库和 NR 数据库搭建

生信常用数据库(二):NT 数据库和 NR 数据库搭建

作者: iBioinformatics | 来源:发表于2023-06-26 17:58 被阅读0次

    前言

    NR和NT数据库是做序列比对经常用到的数据库

    下载

    下载链接:https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/

    这两个数据库一直在不断地更新,数据也越来越大,所以推荐使用下载工具aspera,使用教程可参考小编的另一个博客 NCBI数据下载工具:aspera的安装与使用 - 简书

    使用以下命令下载:

    cd /database/NR
    ascp -i ~/asperaweb_id_dsa.openssh  -QTr -l500m  anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/FASTA/nr.gz ./    
    
    cd /database/NT
    ascp -i ~/asperaweb_id_dsa.openssh  -QTr -l500m  anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/FASTA/nt.gz ./     
    

    安装使用:

    这两个数据库下载下来后进行解压,解压完后建立blast的索引即可进行使用,在建立索引之前需要将blast软件bin文件添加到环境变量~/.bashrc中

    gunzip -c nr.gz >nr.fa  #解压
    makeblastdb -in nr.fa -dbtype prot 
    
    gunzip -c nt.gz >nt.fa   #解压
    makeblastdb -in nt.fa -dbtype  nucl      # nt为核酸序列,-dbtype 为nucl
    

    此时该数据库可以直接使用,以NR数据库进行blastp为例

    blastp -num_threads 8 -max_target_seqs 1 -evalue 1e-4 -outfmt '6 qseqid qlen qstart qend sseqid slen sstart send pident ppos qcovs bitscore evalue' -db /database/NR/nr.fa.00 -query test.fa -out test.fa.blast
    

    数据库官方参考:https://www.biostars.org/p/235632/

    https://www.jianshu.com/p/a29ec02c406a

    相关文章

      网友评论

          本文标题:生信常用数据库(二):NT 数据库和 NR 数据库搭建

          本文链接:https://www.haomeiwen.com/subject/baxszrtx.html