-
基于核酸和蛋白质序列如何研究生物进化?主要步骤是什么?
蛋白质序列分析主要内容:
(1)蛋白质序列的基本性质分析
理化性质分析,疏水性分析,跨膜区分析,信号肽预测,Coil区分析,亚细胞定位
(2)序列数据库搜索
相似性搜索,模体的搜索
(3)结构域定位
(4)多序列比对
序列比对为解决下列问题提供重要信息: - 确定新发现基因的功能;
- 确定基因间、蛋白质间乃至物种之间的进化关系;
- 预测蛋白质的结构和功能:即可以提供结构域相应的信息,蛋白质功能位点的残基、蛋白质亲水性和疏水性的氨基酸残基,从比对结果中得到更多的同源模建或二级结构预测的模板
(5)空间结构预测
二级结构及三级结构预测,结构预测方法评价
1、构建系统进化树。
主要步骤如下: - 序列相似性比较。就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;
- 序列同源性分析。是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;
- 构建系统进化树。根据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,像PYLIP、MEGA等;
- 稳定性检验。为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。通用的方法使用Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。
网友评论