Blast概述:
BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。
blast是常用的比对软件,在linux系统下安装完成blast套件后,可以使用blastn进行核酸序列的比对,基本的使用模式为确定搜索的库,然后使用blastn对指定的序列在库中进行比对,如果想要自定义搜索库,需要使用makeblastdb来创建,更多的细节可以参考blast 官方文档接下来我将介绍如何创建自定义搜索库并进行搜索的步骤。
BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。
BLAST比对原理就是基于序列的相似性,推断该序列的同源基因,又根据同源基因具有相同功能,从而达到功能注释的目的,这个方法往往是有效的。尽管方法会误判(假阳性)或漏判(假阴性),但目前还没有能替代相似性推断同源性的方法,只能通过设置合理的阈值,尽量减少假阳性和假阴性的发生。但相似性并不能证明同源性。
常用的blast
blastn: 核酸序列比对
blastp: 蛋白质序列比对
blastx: 核酸翻译成蛋白质序列,再与蛋白质序列库比对
tblastn:核酸序列库翻译成蛋白质序列库,再与蛋白质序列比对
tblastx:核酸与核酸序列库都翻译为蛋白质序列,再在蛋白质水平上比对
makeblastdb:建立自定义的比对序列库
makeblastdb \
-dbtype prot \
-in H7L1.fa \
-input_type fasta \
-parse_seqids \
-out H7L1.blastdb
建库结果:
blastp 比对
blastp \
-query H7L26.fa \
-db H7L1.blastdb \
-out out/H7L1_H7L26.xls \
-task blastp
blast参数
比对结果
参考链接:
网友评论