1. 多序列比对(multiple sequence alignment)
把两个以上序列对齐,逐列比较其字符的异同,使得每一列的字符尽可能一致,以发现其共同的结构特征。
MSA的目标是使得参与比对的序列有尽可能多的列具有相同的字符,使得相同残基的位点位于同一列,以便发现不同序列之间的相似部分,从而推测他们结构和功能上面的相似关系。
Bring the greatest number of similar character into the same column of the alignment.
2. 为什么要做多序列比对?
⑴ 系统发育分析
用于描述同源序列之间的亲缘关系的远近,应用到分子演化分析中。是构建分子演化树的基础。
⑵ 功能分析
用于描述一组序列之间的相似关系,以便了解一个基因家族的基本特征,寻找motif、保守区域等。用于预测新序列的二级和三级结构,进而推测其生物学功能。
⑶ 突变分析
用于揭示不同个体的基因组由于突变而产生的差异。
不同物种基因组范围的MSA能分析基因组结构变异和共线性。
⑷ 测序分析
用于获得共性序列;用于序列拼接。
3. 怎么做多序列比对?
⑴ 动态规划算法(dynamic programming ):可以给出最优解
⑵ 启发式算法(heuristic algorithm):一个基于直观或经验构造的算法,在可接受的花费下给出待解决组合优化问题每一个实例的一个可行解,该可行解与最优解的偏离程度一般不能被预计。
- 渐进法(progressive methods):Clustal,Muscle
- 迭代法(iterative methods ):PRRP
渐进法——Clustal使用方法:
IMAGE.png
目前被最广泛应用的MSA方法,可在线分析,也可在本地计算机运行。Clustal包括ClustalX和ClustalW。
ClustalX——图形化界面版本
ClustalW——命令界面
Clustal在线分析方法(Clustal Omega)
网友评论