美文网首页
史上最全的BLAST本地化教程(一)BLAST简单介绍

史上最全的BLAST本地化教程(一)BLAST简单介绍

作者: 大号在这里 | 来源:发表于2020-08-05 21:26 被阅读0次

一、BLAST产生背景

双序列比对可以采用是基于动态规划算法的Needleman-Wunsch(NW)和Smith-Waterman algorithm(SW)算法,虽然精度高,但计算消耗大。当与数据库比对的时候,该算法就显得不切实际。因此BLAST采用启发式算法使得通过大幅度丢失灵敏度来减少运行时间。与FASTA软件相比,BLAST通过把搜索限制在狭隘的矩阵对角线条带上,来改进FASTA进行数据库搜索的速度。

二、什么是BLAST?

BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速将核苷酸或蛋白质序列与公开数据库进行相似性序列比较,并计算匹配的统计显著性。进而可用于推断序列之间的功能和进化关系,并帮助识别基因家族成员。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course ,该页有BLAST算法的介绍。找到序列之间的局部相似区域。该程序与序列数据库进行比较,

三、BLAST的大致原理

BLAST程序首先查询query序列的所有子序列,储存在哈希表中。收索数据库中所有与子序列精确匹配的序列,作为种子,向两个方向继续延伸每个精确匹配。期间不允许有空位和错配的情况。然后在限制性区域内;连接延伸的匹配序列,期间允许空位和错配,比对分值要大于设定的阈值。阈值越大,需要匹配的计算越小,软件计算速度越快。仅仅对对延伸匹配进行连接的区域(限制性区域),而不是整个矩阵,是BLAST相对于其他算法速度提高的关键,是以牺牲对角线带以外的任何匹配信息为代价,因此并不能确保query序列与数据库比对结果是最优的比对结果。

四、BLAST 5种比对工具的选择

BLAST 5种比对工具
  1. BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

  2. BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。

  3. BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

  4. TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。

  5. TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。

五、BLAST本地化安装配置

1. 源码安装:
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.1+-x64-linux.tar.gz

wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.1+-x64-linux.tar.gz

tar -zxvfncbi-blast-2.2.30+-x64-linux.tar.gz

export PATH="/mnt/nas1/wanghw/software/ncbi-blast-2.10.1+/bin:$PATH" >>~/.bashrc

source~/.bashrc
2. conda安装:

先conda search blast 查看包含哪些版本,最后选择所需要的版本进行安装,如

conda search blast

conda install blast2.2.31

参考:
http://www.mamicode.com/info-detail-410455.html

相关文章

网友评论

      本文标题:史上最全的BLAST本地化教程(一)BLAST简单介绍

      本文链接:https://www.haomeiwen.com/subject/bnrorktx.html