蛋白质测序的一般流程
蛋白质测序通常包括三个步骤:
1.用酶将蛋白质酶切成长度较短的多肽;
2. 对产出的每段多肽进行测序;
3. 将测出的肽序列组装形成一条完整的蛋白序列。
下图阐述了用质谱法进行蛋白质测序的整个过程:
LC-MS / MS蛋白质测序步骤图(来源:百泰派克)蛋白质质谱测序中的的挑战和应对方案
蛋白质质谱测序(即利用质谱法进行蛋白质测序)并不是什么新的概念,然而,这个概念里看似简单的步骤在实践操作过程中却有很多挑战,尤其是想要通过这些步骤对蛋白质的所有氨基酸进行高通量测序时。
来自同一蛋白质或其他污染物的不同部分的两种肽可能偶然存在小段重叠。因此,为了促使步骤三(肽序列组装)顺利进行,步骤一中产生的肽应具有更长段的重叠区域以排除随机匹配。这可以通过在蛋白质不同的位点选择不同的酶进行酶切以及创造故意错过酶切位点的酶切条件来实现。但是,非标准酶产生的图谱不适用于蛋白质组学中使用的标准分析软件进行分析。百泰派克生物通过使用专门针对每种酶和酶切条件的算法参数定制的软件可解决此问题。
每个图谱的从头序列都有可能包含测序错误,这也是基于MS / MS技术的蛋白质从头测序法的基本局限性。如果处理不当,肽段上的错误会延伸到最终的蛋白质测序结果中。百泰派克采用的“氨基酸可信度评分”机制可很好地解决此问题,该评分机制可测量肽测序结果中每个残基的质量。根据评分结果,选择高可信度的残基来完成最终的蛋白质测序结果。百泰派克通过反复的真实数据演练,不断完善了其“氨基酸可信度评分”机制的使用。
蛋白质从头测序中肽序列组装过程在算法上比较困难,因此大多数蛋白分析软件/工具都选择只用数据库搜索或同源性搜索方法,以此避免组装这一步骤。这种搜索类型的方法会不断修饰参照抗体序列,直到得到最终答案为止。当参照蛋白质序列和目标蛋白质序列之间的差异较小时,数据库搜索或同源性搜索方法还是很有效的,但是,该法在实践过程中常常会遇到困难或给高变区产出错误的序列。此外,对参考序列过度依赖还会对该序列的判断产生偏差。百泰派克公司基于高分辨率质谱仪Obitrap Fusion Lumos,结合丰富的生物信息学分析经验,采用全新一代蛋白质从头测序和突变分析(De Novo Sequencing)平台,可对蛋白一级结构进行快速准确的分析。
网友评论