网络上关于构建进化树的教程非常多,这里只挑重点部分讲解。
常见算法:Neighbor-Joining、Maximum Likelihood
1. 参数设置:
图片.png图片.png
Test of Phylogeny:建树的检验方法
常用Boot strap method (步长检验)
是根据所选的建树方法,计算并绘制指定次数棵系统发育树。大多数建树方法的核心算法都是统计概率模型,所以每次算出的数都会有所差别,用Boot strap method检验方法,建好的系统发育树上每个节点上都会标记一个数字,代表了指定次数次计算所得出的系统发育树中有百分之几的树都有这一节点。绝大多数节点数值大于70%的树才可信,个别低于70%也可忽略。也可以通过增删序列来改善质量。
No. of Bootstrap Replications:一般设置步长为500-1000;
Substitution Model :计算遗传距离时使用的计算模型
Model/Method: p-distance
理论上需尝试各种模式,然后选择合适的模型进行计算。实际操作中通常选择距离模型,如p-distance即可。
Gaps/Missing Data Treatment:
删除多序列比对中含有空位的列,遗传距离度量方法不同,删减原则不同;
如序列间不同残基个数来度量遗传距离,则选择complete deletion ;
如采用Neighbor-Joining,则选择Partial deletion部分删除,删除程度保持50%。
2. 生成进化树
左侧标签页:
原始树:步长检验时构建1000棵树中的一个。未经过多棵树合并,树的长短可精确代表遗传距离。
右侧标签页:
图片.png步长检验合并树,树上节点处数字表示经过步长检验,有x%个树都具有这个数支。反应了树支的可信度
3. 树形美化:
View > Options
图片.png
更改树支形状或根等:
图片.png
导出为矢量格式,如pdf 或EMF,添加到AI中进行下一步美化,呈现效果如下:
图片.png
4. 遗传距离计算
"Distance" > "compute pairwise Distances"
图片.png
设置参数如上,继续下一步
图片.png 图片.png
5. 文件保存
- 序列比对的结果保存:
"data" > "save session ",文件后缀名为.mas
打开文件:"Align" > "Open saved Alignment session"
"Export Alignment" > "MEGA Format",文件后缀名为.meg
打开文件:双击文件即可打卡
- 进化树保存
"File" > "Save current session" ,文件后缀名为.MTS
打开:"User Tree" > "Open Tree Session"
Display Newick Trees,文件后缀名为.nwk
"File" > "Export current Tree (Newick)"
注意,打开的nwk文件只有整合后树文件,而没有源树支。nwk文件可以导入其他在线的进化树美化网站做进一步地修饰。
- 导出图片:
"image" 选择导出EMF PDF PNG格式的图片。
参考资料:
网友评论