序列比对与blast

作者: pearlp | 来源:发表于2017-12-17 12:45 被阅读14次

    1、Global alignments 全局比对:尽可能保证两条序列的碱基都能配对,因此会有比较多的错配和gap,但是不会对序列两端对gap进行罚分。

    2、Local alignments 局部比对:尽可能的找到能最优匹配对子区域。

    3、多序列比对:常用的软件为: mafft, muscle, clusta-omega, t-coffee等,是全局比对。

    4、BLAST (Basic Local Alignment Search Tool),结果是局部比对。Its purpose is to search a large body of known information for similarities (hits).

    5、如何使用blast

    1⃣️ Prepare a BLAST database with makeblastdb. This only needs to be done once.

    2⃣️Pick a blast tool--blastn\blastp\blastx\tblastn\tblastx, as appropriate (use -h to see and chose the parameters).

    3⃣️Run the tool and format the output as needed (-outfmt 6 or 7 to format the outputs into tabular or even add custom fields to the output).

    4⃣️如果只有两条序列,则不需要构建database,blastn可以直接进行pairwise alignment,命令如下:blastn -query query.fa -subject ~/refs/ebola/KM233118.fa

    5⃣️ blastn -task 选项可以选择多种模式:

                    blastn - finds more divergent sequences;megablast - finds less divergenent sequences;blastn-short - short queries 

    6⃣️blast 会自动过滤掉一些低复杂度的序列(高度重复)使用 -dust no 关闭过滤。

    6、blast databases

    1⃣️现成的databases:ftp://ftp.ncbi.nlm.nih.gov/blast/db/

    2⃣️

    3⃣️blastdbcmd :queries blast databases. -info

            List the content of the blast database:blastdbcmd -db index/all -entry 'all' -outfmt "%a"

    4⃣️elink : to see which publication links to this sequence?

            esearch -db nuccore -query NR_118889.1 | elink -target pubmed | efetch

    5⃣️reformat database

            blastdbcmd -db ~/refs/refseq/16SMicrobial -entry 'all' -outfmt '%a,%l,%T,%L' | tr ','  '\t' 

    6⃣️extract a specific entry

            Get the first 20 bases of a specific 16S gene:blastdbcmd -db  ~/refs/refseq/16SMicrobial -entry 'NR_118889.1' -range 1-20

    7、extractfeat

    相关文章

      网友评论

        本文标题:序列比对与blast

        本文链接:https://www.haomeiwen.com/subject/xueewxtx.html