通过pbs脚本进行blast+本地化

作者: 草莓苹果大橘子 | 来源:发表于2021-03-10 09:15 被阅读0次

通过pbs脚本进行blast+本地化
Job scheduling - qsub
本地化BLAST+进行目标序列比对
PBS脚本提交任务
pbs_python（pbs C语言库基于python的实现）
利用集群(cluster)运行R脚本的技巧
Jenkins清空Jenkins构建队列并停止所有正在运行的作业
Linux本地化运行NCBI blast+
Windows本地化运行NCBI blast+
2019-06-09

cd “文件目录” #将当前目录切换到目标路径下

makeblastdb -in uniprot.fasta -dbtype prot -parse_seqids -hash_index -out uniprot #建数据库

参数说明：

-in 需要建库的fasta序列

-dbtype 如果是蛋白库则用prot，核酸库用nucl

-out 所建数据库的名称

-parse_seqids 和 -out uniprot 一般都加上，解释如下：

-parse_seqids => Parse Seq-ids in FASTA input #我也不懂这是干啥

-hash_index => Create index of sequence hash values

blastp -query protein.fasta -db uniprot -evalue 1e-3 -out blast.xml -outfmt "5" -num_alignments 10 -num_threads 2

-query 输入文件名，也就是需要比对的序列文件

-db 格式化后的数据库名称

-evalue 设定输出结果中的e-value阈值

-out 输出文件名

-num_alignments 输出比对上的序列的最大值条目数

-num_threads 线程数

此外还有：

-num_descriptions 对比对上序列的描述信息，一般跟tabular格式连用

-outfmt

0 = pairwise,

1 = query-anchored showing identities,

2 = query-anchored no identities,

3 = flat query-anchored, show identities,

4 = flat query-anchored, no identities,

5 = XML Blast output,

6 = tabular,

7 = tabular with comment lines,

8 = Text ASN.1,

9 = Binary ASN.1

10 = Comma-separated values

例子

[ZCH_luxm@login ~]$ cat /public/home/ZCH_luxm/At/Aar_CEF.pbs

#PBS

#PBS -N Aar_CEF

#PBS -l nodes=1:ppn=5

#PBS -q batch

#PBS -o /public/home/ZCH_luxm/At

#PBS -e /public/home/ZCH_luxm/At

module load apps/ncbi-blast/2.10.1

blastp -query /public/home/ZCH_luxm/At/At_CarbohydrateEsteraseFamily_pep1.fasta -db /public/home/ZCH_luxm/Actinidia_arguta/Aar_protin_simple_db/A.arguta-protin-simpleID.db -evalue 1e-5 -out /public/home/ZCH_luxm/At/Aar_CEF_blast1.xml -outfmt 6

根据自己的需求设定blast参数

本文部分内容摘抄于http://www.bioinfo-scrounger.com