cd “文件目录” #将当前目录切换到目标路径下
makeblastdb -in uniprot.fasta -dbtype prot -parse_seqids -hash_index -out uniprot #建数据库
参数说明:
-in 需要建库的fasta序列
-dbtype 如果是蛋白库则用prot,核酸库用nucl
-out 所建数据库的名称
-parse_seqids 和 -out uniprot 一般都加上,解释如下:
-parse_seqids => Parse Seq-ids in FASTA input #我也不懂这是干啥
-hash_index => Create index of sequence hash values
blastp -query protein.fasta -db uniprot -evalue 1e-3 -out blast.xml -outfmt "5" -num_alignments 10 -num_threads 2
-query 输入文件名,也就是需要比对的序列文件
-db 格式化后的数据库名称
-evalue 设定输出结果中的e-value阈值
-out 输出文件名
-num_alignments 输出比对上的序列的最大值条目数
-num_threads 线程数
此外还有:
-num_descriptions 对比对上序列的描述信息,一般跟tabular格式连用
-outfmt
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = XML Blast output,
6 = tabular,
7 = tabular with comment lines,
8 = Text ASN.1,
9 = Binary ASN.1
10 = Comma-separated values
例子
[ZCH_luxm@login ~]$ cat /public/home/ZCH_luxm/At/Aar_CEF.pbs
#PBS
#PBS -N Aar_CEF
#PBS -l nodes=1:ppn=5
#PBS -q batch
#PBS -o /public/home/ZCH_luxm/At
#PBS -e /public/home/ZCH_luxm/At
module load apps/ncbi-blast/2.10.1
blastp -query /public/home/ZCH_luxm/At/At_CarbohydrateEsteraseFamily_pep1.fasta -db /public/home/ZCH_luxm/Actinidia_arguta/Aar_protin_simple_db/A.arguta-protin-simpleID.db -evalue 1e-5 -out /public/home/ZCH_luxm/At/Aar_CEF_blast1.xml -outfmt 6
根据自己的需求设定blast参数
本文部分内容摘抄于http://www.bioinfo-scrounger.com
网友评论