[序列比对和序列特征分析总目录](https://www.jianshu.com/p/878f2b2495ae
蛋白质是生命功能的执行者,一切生命活动都与蛋白质有关。
我们知道,蛋白质结构分为一级结构和空间结构,而空间结构包含二级三级和四级结构,空间结构是蛋白质功能的关键。而一级结构又决定空间结构,也就是说空间结构的信息蕴藏在一级结构中。
一级结构指的是蛋白质中氨基酸的排列顺序,和DNA一级结构一致。
也就是说蛋白质发挥什么功能,基本在一级结构中就确定了。
对蛋白质序列进行基本信息分析可以帮助了解蛋白质的基本信息。这主要有分子量,等电点pI,氨基酸组成,亲疏水性质等的分析。
5.1 强大的ExPASy(Expert Protein Analysis System)
ExPASy提供一系列的蛋白质厉害性质的工具,包含的蛋白分析工具十分全面。瑞士生物信息学研究院进行维护,和前述的EBI和PIR联合组成了UniProt数据库。
注意:网站声明tools页面不再进行更新,但链接依然生效。
ExPASy
5.1.1 未知的蛋白质氨基酸组成分析AACompIdent
该工具通过将未知的氨基酸组成百分比与Uniprot数据库中的蛋白质理论氨基酸组成百分比进行匹配,从而对未知蛋白质进行鉴定识别
AACompIdent image.png
结果之一如下
image.png
说明,邮件会有三张表格分别解释如下
- 1 第一张表,包含的蛋白质基于特定物种分类,但不考虑pI和分子量限制
- 2 第二张表,包含不考虑物种,pI和分子量限制的全部蛋白质
- 3 第三张表同时既基于特定物种,又考虑pI和分子量。
每张表的解释,Rank越靠前的,Score越低,分越低代表最优匹配。如果score为0表示,输入的未知蛋白的组成与数据库中的序列完全符合。
5.1.2氨基酸的理化性质分析
包括氨基酸组成,pI,MW,消光系数,亲/疏水性。
工具:ProParam
提交的格式可以是Swissprot的记录号也可以是氨基酸序列,输入一段TIGD1序列,提交,结果如下
部分结果解释
- 消光系数: 表示蛋白质对某波长的吸收能力。Protparam不考虑蛋白质二级和三级结构的情况下,根据氨基酸组成来估算消光系数。准确的需要实验获得。
- 体内半衰期:蛋白质在细胞内合成后,含量消失一半所需要的时间,用来衡量蛋白质的稳定性。Protparam可以预测蛋白质在人,酵母和大肠杆菌中的体内半衰期,可以作为其他物种内的参考。
- 不稳定系数:作文蛋白质在体外测试中稳定性的参考值。40以下,提示稳定性好,大于40提示蛋白质可能不稳定。
- 脂肪指数:蛋白质中脂肪族侧链氨基酸(Ala,Val,Leu,Ile)含量的相对值,可以作为球状蛋白质热稳定性增加的一个有利因素。
- 蛋白质的总平均亲水性:预测蛋白质中所有氨基酸的亲水性值总和初一氨基酸残基数量得到。
5.1.3 蛋白质的亲疏水性分析
疏水性氨基酸具有相互聚合隐藏到蛋白质分子内部的趋势,这种力称为疏水作用力,维持蛋白质三级结构的主要作用力。因为氨基酸的亲疏水性是构成蛋白质折叠的主要驱动力之一,因此蛋白质亲水性分布可以反映蛋白质的折叠情况。 蛋白质总体折叠结构是亲水基团向外,疏水基团向内,并在跨膜区形成高疏水值区域,据此可以测定蛋白质的跨膜螺旋等二级结构的位置。
工具ProtScale
image.png结果如下
结果说明
- 纵坐标Score,大于0表示疏水性,小于0表示亲水性。
网友评论