美文网首页序列比对
生信常用数据库(三):SwissProt和TrEMBL数据库搭建

生信常用数据库(三):SwissProt和TrEMBL数据库搭建

作者: geneonto | 来源:发表于2020-10-22 14:38 被阅读0次

    前言

        UniProt是信息最丰富、资源最广的蛋白质数据库,由两大部分组成,SwissProt和TrEMBL,SwissProt为高质量的、手工注释的、非冗余的数据集,TrEMBL包含未校验的、自动注释的条目,这两数据库在基因组注释中会常用到,尤其是高质量的SwissProt数据库。

    下载

        选择Swiss-Prot和TrEMBL的fasta文件下载即可

    下载链接: Download

    安装

        Swiss-Prot和TrEMBL数据库解压后用blast建立索引即可使用(blast软件添加环境变量)

    gunzip uniprot_sprot.fasta.gz    #解压

    makeblastdb -in uniprot_sprot.fasta -dbtype prot  #建索引

    gunzip uniprot_trembl.fasta.gz   #解压

    makeblastdb -in uniprot_trembl.fasta -dbtype prot  #建索引

        建完索引后可以直接用blast软件进行比对

    相关文章

      网友评论

        本文标题:生信常用数据库(三):SwissProt和TrEMBL数据库搭建

        本文链接:https://www.haomeiwen.com/subject/hewumktx.html