多序列比对(多序列联配,Multiple sequence alignment, MSA)是指把多条(3 条或以上)有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对,尽可能地把相同的碱基或氨基酸残基排在同一列上。这样做的意义是,对齐的碱基或氨基酸残基在进化上是同源的,即来自共同祖先(common ancestor)。
多序列比对的软件有很多,最常用的多的序列比对软件是 clustalw 。 有文献报道:比对速度(Muscle>MAFFT>ClustalW>T-Coffee),比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)。因此,推荐使用 MAFFT 软件进行多序列比对。
使用了之前注释的水稻基因组数据,将其转换成蛋白质文件,
gffread H7L1.EVM.all.gff -g /public/home/fengting/task/222anno/21/data/H7L1.arrow.polish.fasta -y tr_cds.fa
使用conda安装mafft,输入mafft,显示版本信息
按照软件要求输入信息,
成功运行
网友评论