ESPript3.0网址:https://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
氨基酸序列的多重序列比对是重要的生物信息学分析方法,常用的工具软件有MEGA, DNAMAN, ClustalX等,但并不能生成高质量、美观的图片。ESPript 3.0可以全面、高质量地展示多重序列比对结果,并且可以同时展示序列的二级结构,突出序列的细节和重点,分析序列的亲疏水性和相对可溶性等。
ESPript 3.0网页界面显示出三种模式(MODE),自左至由分别为初级 BEG (BEGinner),进阶级 ADV (ADVanced)和专业级 EXP (EXPert)。使用者可根据自身需求选择不同的模式作图。根据不同的使用需求,下面将分别介绍其基本功能和进阶功能。
本次介绍初级功能BEG (BEGinner)
前期准备:
首先,使用Clustal X或MEGA做氨基酸序列的多序列比对并将结果保存为.aln或.fasta格式。
随后,预测目的蛋白的三维结构,为了尽量全的展示序列结构,建议使用ITASSAR预测。
下面以人类、小鼠和斑马鱼的sod1多序列比对为例讲解。
1. 用MEGA做多重序列比对并保存.fas格式,将多重序列比对结果拖入或添加入Aligned Sequences, 同时勾选Number sequences.
如果只是需要一个多重序列比对的结果,此后的步骤就可以接看步骤3及以后步骤。此时所得到的结果如下:
2. 从PBD库中下载小鼠SOD1蛋白三维结构3GTT.pdb,并将pdb文件拖入Secondary structure depiction; 若三维结构为多聚体,在Chai ID处写出需要展示的氨基酸链,此处选择为A链。
注:软件默认二级结构展示出的为多重序列比对中的第一个序列,如二者不对应,则需要进一步自定义序列顺序。
而本例子中第一个序列为SOD1_human,与提供的小鼠SOD1三维结构模型不对应,因此需要在Sequences to display处自定义序列顺序。
3. 选择序列相似性描述参数
通常默认即可
4. 定义序列顺序
如不需要自定义顺序,则默认参数即可(all)。
此处将序列的顺序改为:2 1 3
5. 序列比对输出定义
序列输出调整可以自行尝试
6. 选择输出图片格式
可以选择不同的格式与分辨率。等待生成后保存即可。
输出结果:
网友评论