整理:dayueban
主要目的是方便日常对测序数据,如编码某个蛋白的基因在物种间序列上的相似性比较。
一、软件下载和安装
blast软件网址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
选择64位系统- 软件安装,下载后,点击安装,和平时安装软件的方法无异,安装位置可以是C盘或者其它盘,但是注意,一般的软件最好选择安装位置的时候路径中不要有中文,否则影响后续正常运行。
二、添加环境变量
-
安装好后,会出现doc和bin两个文件夹,doc是文件,bin是执行程序所在的文件夹,将bin所在路径添加到所在系统环境变量,方法为:首先右键点击我的电脑——>属性——>高级系统设置——>高级——>环境变量——>系统变量——>选择
path
——>编辑——>新建——>copy路径:F:\bio-tools\blast\blast\bin
到该位置——>确定,完成。 -
win+R打开电脑运行,输入cmd进入docs系统,进入到blast软件的bin路径,输入blastp -h,如果能出来帮助信息,说明安装成功,接下来就可以进行相应的blast比对操作了。
三、blast试运行
- 首先blast运行比对之前,要对目标数据库进行建索引
我在NCBI里下载了两个细菌菌株的全基因组蛋白序列,一个是Eubacterium dolichum(a),一个是Eubacterium biforme(b)。其中a作为目标参考数据库,b用于比对数据。
- 建索引
makeblastdb.exe -in db\Eubacterium_dolichum.faa -dbtype prot -out db\Eubacterium_dolichum.faa.blastdb
-
补坑,建立索引这一步,出现了相应的报错,
图二blast Error: mdb_env_open: 磁盘空间不足。
,在网上搜索一通,找到一个解决方法,就是在用户变量里设置一个参数:BLASTDB_LMDB_MAP_SIZE=1000000
解决了这个问题。 -
建立好索引之后,那就是将需要比对的序列去和参考序列进行比对,得到比对结果
blastp -query F:\bio-tools\blast\data\Eubacterium_biforme.faa -db db\Eubacterium_dolichum.faa.blastdb -out db\results.txt -outfmt 6 -evalue 1e-5
网友评论