背景
blast(basic local alignment search tool)全家桶 | 详细 |
---|---|
blastn | 核酸vs核酸。将给定的核酸序列与核酸数据库中的序列进行比对。 |
Blastp | 蛋白质vs蛋白质。使用蛋白质序列与蛋白质数据库中的序列进行比对。可以寻找较远源地序列。 |
Blastx | 将给定的核酸序列按照六种阅读框架将其翻译成蛋白质与蛋白质数据库中的序列进行比对。对分析新序列和EST很有用。 |
BLASTX由于高灵敏度,长期以来被认为是做这方面比对(核酸vs蛋白质)的金标准工具,但它运行很慢,所以就出现了Blat、Usearch、Rapsearch2、Pauda等软件,比blastx快。而diamond则是更快更好。
diamond(double index alignment of next-generation sequencing data)出现了,它只能用于比对蛋白数据库。Diamond是用C++开发的,该程序的显式设计是为了利用存储容量大、内核多的现代计算机体系结构;是一种基于双索引的开源算法,在读短片段上(short reads)比bLastX快2万倍,并且具有相似的灵敏度(当针对NCBI-nr数据库中Evalue预期值低于的显著比对时)。用BLASTX分析1个月,用DIAMOND分析仅需几分钟。
DIAMOND- fast模式使用4种种子,运行速度约为BLASTX的2万倍。针对Illumina reads比对结果,DIAMOND-sensitive模式使用16种种子,运行速度比BLASTX快约2000倍,能比对上BLASTX的99 %reads,获得所有BLASTX比对上reads的92 %以上。
对齐程序使用的种子长度对性能有很大影响;较短的种子增加敏感性,而较长的种子增加速度。
网友评论