Bartels于1990年提出使用图论方法来解决从头测序的问题。许多研究学者提出的算法都可以归纳到此类型中,其中包括Lutefisk、PepNovo、MSNovo、pNovo等。
基于图论的从头测序基本流程图(来源:百泰派克)Lutefisk
Lutefisk方法可以利用CID质谱处理从头测序。该法中,首先找到图谱中的显著离子,然后确定N端和C端离子位置,并构建一个序列谱。根据序列谱,在图谱上生成完整的序列,并用实验图谱对其进行评分。因为结果可能包含几个仅有很小差异的候选序列,因此比较难确定完全正确的肽序列。Alex Taylor根据Bill Pearson的FASTA算法修改后的得到的版本CIDentify,可以用来区分这些不确定的相似的候选序列。
PepNovo
2005年,Frank等提出了PepNovo算法。该算法是一种高通量肽从头测序法,它引入了概率网络模型作为评分机制。使用该法解析一个图谱通常仅需不到0.2秒的时间。根据Frank等人的描述,PepNovo比Sherenga,PEAKS和Lutefisk等几种流行算法好。现在PepNovo已经更新到了新版的PepNovo+。同年,Grossmann等提出了AuDeNS。它是一种自动化的肽从头测序工具,该工具中包含了一种可以识别信号峰和噪声峰的预处理模块。
MSNovo
2007年,Mo等人提出了MSNovo法。根据Mo的介绍,MSNovo方法在多个数据集上的表现比以前的从头测序方法表现得更好。该方法可以支持LCQ,LTQ等多种质谱产出的数据,并能支持+1、+2、+3价的母离子。与其他算法不同的是,它还引入了一个新的评分机制,同时结合质谱矩阵,使用动态规划方法解决从头测序问题。
pNovo
2013年,Chi等人推出了一种新的肽从头测序算法,pNovo。该算法可用于高能碰撞解离(HCD)类型数据的从头测序。根据Chi等人描述,使用数据库搜索方法鉴定出的HCD图谱中,80%以上序列都能被pNovo正确测定。
本文由百泰派克生物整理编辑,参考文献:
孙汉昌等,2010,串联质谱图谱从头测序算法研究进展。
De novo peptide sequencing,en.wikipedia.org/wiki/De_novo_peptide_sequencing#cite_note-14
百泰派克是一家质谱技术服务公司,主要提供蛋白质理化性质分析及结构解析、以质谱技术为基础的蛋白质组学代谢组学技术服务。公司致力于建立国际领先的蛋白质研究分析技术平台,为各科研院所和大学提供高效、准确、性价比高的蛋白质(组)研究技术包裹,协助客户在基础研究、分子诊断及其他生命科学研究领域取得突破,为生命科学的发展做出贡献。
网友评论