https://www.jianshu.com/p/43278a69fe3b
https://www.jianshu.com/p/4c7c86d80487
https://www.jianshu.com/p/19ce91d3dfe8
进行多序列比对并且对齐
0. 文章
image.png
1. 输入
输入是一个
fasta
文件,里面包含的所有序列都会被做同一次比对
2. 输出
输出也是一个
fasta
文件,序列条数和输入相同,里面的每条序列都被对齐,其中相对于其他序列不同的部分会被-
补齐
3. 比对方法
mafft --maxiterate 1000 --localpair --quiet --thread -1 input.fasta > output.fasta
--quiet
: 不报告处理过程
--thread
: 线程数
根据需要比对的序列的不同选择不同的比对方法
4. 示例一
查看输入
(RStudio-5) zhiyong@zhiyong-OptiPlex-7050:~/Desktop/ZZZZZZZZZZZ/kk$ cat kk.fasta
>Dmel-18w
MPATSSIITAAIIAVAACLLLLVADAHAQQQCNWQYGLTTMDIRCSVRYALESGTGTPLDLQVAEAAGRLDLQCSQELLHASE
>Dsim-18w
MTKMPATSSIITIIAVAACLLLLVADAHAQQQCNWQYGGFHTLTTMDIRCSVRALESGTGSPLDLQVAEAAGRLDLQCSQELLH
>Dyak-18w
MPATSSINNIIIAVAACLLLLVADAHAQQQCNWQYGLTTMDIRCSVFRALESGSGSPLDLQVAEAAGRLELQCSQELLHASLCA
进行比对
(RStudio-5) zhiyong@zhiyong-OptiPlex-7050:~/Desktop/ZZZZZZZZZZZ/kk$ mafft --maxiterate 1000 --localpair --quiet kk.fasta > alignment.fasta
查看输出
(RStudio-5) zhiyong@zhiyong-OptiPlex-7050:~/Desktop/ZZZZZZZZZZZ/kk$ cat alignment.fasta
>Dmel-18w
---MPATSSIITAAIIAVAACLLLLVADAHAQQQCNWQYG----LTTMDIRCSVRYALES
GTGTPLDLQVAEAAGRLDLQCSQELLHAS--E
>Dsim-18w
MTKMPATSSIIT--IIAVAACLLLLVADAHAQQQCNWQYGGFHTLTTMDIRCSV-RALES
GTGSPLDLQVAEAAGRLDLQCSQELLH-----
>Dyak-18w
---MPATSSINN-IIIAVAACLLLLVADAHAQQQCNWQYG----LTTMDIRCSVFRALES
GSGSPLDLQVAEAAGRLELQCSQELLHASLCA
网友评论