前言
UniProt是信息最丰富、资源最广的蛋白质数据库,由两大部分组成,SwissProt和TrEMBL,SwissProt为高质量的、手工注释的、非冗余的数据集,TrEMBL包含未校验的、自动注释的条目,这两数据库在基因组注释中会常用到,尤其是高质量的SwissProt数据库。
下载
选择Swiss-Prot和TrEMBL的fasta文件下载即可
下载链接: Download
安装
Swiss-Prot和TrEMBL数据库解压后用blast建立索引即可使用(blast软件添加环境变量)
gunzip uniprot_sprot.fasta.gz #解压
makeblastdb -in uniprot_sprot.fasta -dbtype prot #建索引
gunzip uniprot_trembl.fasta.gz #解压
makeblastdb -in uniprot_trembl.fasta -dbtype prot #建索引
建完索引后可以直接用blast软件进行比对
网友评论