美文网首页
后基因组——蛋白质组学简史

后基因组——蛋白质组学简史

作者: DarkMoon | 来源:发表于2022-10-10 21:36 被阅读0次

    2022.08.31在JAMA Network的一篇评述(原文 After the Genome—A Brief History of Proteomics | Genetics and Genomics | JAMA | JAMA Network

    美国国立卫生研究院蛋白质组学科学兴趣小组联合主席Aleksandra Nita-Lazar博士在接受JAMA采访时说:“蛋白质组学的复杂性使其成为一项挑战。”“这就是为什么要花这么长时间才能得到每个生物体的完整蛋白质组,因为蛋白质会根据条件发生很大变化。” (我的注释:在多个维度如时间、空间上的表达、修饰与结构动态变化造成了其复杂性。)

    与此同时,蛋白质组学在医学上的潜力正在显现,因为某些蛋白质和蛋白质组图谱与疾病有关。《公共科学图书馆数字健康》(PLOS Digital Health)杂志最近的一项研究探索了需要重症监护的COVID-19患者生存的蛋白质组学预测因素。《科学报告》(Scientific Reports)和《电子生物医学》(ebiomedmedicine)的研究探讨了血浆蛋白质组分析如何决定COVID-19病例的严重程度。

    研究人员已经开发出了所谓的人类蛋白质组的图谱(作者引用的2014年NATURE论文,A draft map of the human proteome;实际上,全人蛋白质图谱有多个,直到这些图谱发布之后才发现其问题所在),即在人体内表达的一整套蛋白质。人类蛋白质组是由亚蛋白质组(subproteomes)组成的,因为每种细胞类型都有自己独特的蛋白质组。然后是蛋白型(proteoforms),它们组成了蛋白质组,这些蛋白质型是由基因组产生的蛋白质变体(protein variants)或形式(protein forms)。

    一个基因可以产生一组有细微差异的蛋白质。“例如,在肝脏、大脑、肾脏或血液和骨髓中的造血系统中表达的人类基因,这些创造了所有不同的蛋白型,呈现了人类蛋白质组的未知前沿,”西北大学西北蛋白质组学和生命过程化学研究所主任Neil Kelleher博士在接受JAMA采访时说。

    现在,研究人员的目标是在人体中产生一套参考的蛋白质图谱(The Human Proteoform Project: Defining the human proteome | Science Advances),并希望完成整个人类蛋白质组的绘制。

    Proteoforms: Distinct protein forms arising from a single gene

    .

    开端

    二维(2D)凝胶电泳(2-DE)——一种用于分离、分片段和分析从生物样本中提取的蛋白质的技术——使蛋白质组学分析成为可能。1975年发表了第一篇2-DE蛋白质组学的研究(2-DE was first independently introduced by O'Farrell and Klose in 1975.)。利用2D凝胶技术,研究人员绘制了小鼠、豚鼠和大肠杆菌的蛋白质图谱,并根据电荷和分子量大小分离了这些蛋白质。(原理 2-DE separates proteins depending on two different steps: the first one is called isoelectric focusing (IEF) which separates proteins according to isoelectric points (pI); the second step is SDS-polyacrylamide gel electrophoresis (SDS-PAGE) which separates proteins based on the molecular weights(relative molecular weight, Mr). )

    2D-Gels (Coomassie stained)

    在20世纪90年代和21世纪初,随着第一批微生物基因组的测序和人类基因组计划的发展,蛋白质和基因组学领域取得了进一步的进展。到了世纪之交,蛋白质组学的分析对2D凝胶的依赖减少,而质谱技术的进步使人们得以分析带电多肽从而解析其中的蛋白质。研究人员现在可以将蛋白质分馏并进行更可靠的鉴定。这也使得研究复杂的蛋白质混合物而不是单一的蛋白质成为可能。然而,描述蛋白质研究的术语还没有出现在词典中。

    冠名时刻

    尽管可以被认为是蛋白质组学的初步研究在近50年前就发表了,但包括Marc Wilkins博士在内的一批研究人员直到1994年才创造出蛋白质组(proteome)这个术语,他目前是澳大利亚悉尼新南威尔士大学(UNSW)的系统生物学教授。随后,作为一名参加意大利2D电泳会议的博士生,Wilkins发表了一篇关于蛋白质鉴定技术的合著论文。他还讨论了新的术语。

    Wilkins在接受《美国医学会杂志》(Biotechnology and Genetic Engineering Reviews)采访时回忆说:“虽然你可以用基因组(genome)来描绘所有的基因gene,但没有一种方法可以对蛋白质做同样的事情。”他的解决方案是:“将protein和-ome结合起来似乎是显而易见的,因为它已经被用于基因组和生物组。”因此,蛋白质组(proteome)这个词出现了。

    1995年,威尔金斯在《电泳》(Electrophoresis)杂志上发表了第一篇提到蛋白质组名词(proteome)的期刊文章。“‘蛋白质组’指的是基因组的总蛋白质补体,”他和他的同事写道。Wilkins在《生物技术与基因工程评论》上的另一篇合著文章进一步定义了这个术语:“作为‘基因组计划’(genome project)概念的外推,‘蛋白质组计划’(proteome project)是寻求识别存在于细胞或组织中的蛋白质并确定其特征并确定其表达模式的研究。”

    又过了近20年(2013): Kelleher和他的同事Lloyd Smith,威斯康星大学麦迪逊分校的化学教授,提出了“proteoform”这个词,“用来表示单个基因的蛋白质产物可以被发现的所有不同的分子形式,包括由于遗传变异、选择性剪接的RNA转录物和翻译后修饰引起的变化。”使用该术语的理由发表在2013年的《自然方法》(Nature Methods)杂志上。(Proteoform: a single term describing protein complexity | Nature Methods

    关键节点

    人们试图用多种不同的手段从不同的项目出发,目标是完成人类蛋白质组绘制。这些努力之一是人类蛋白质组组织(Human Proteome Organization’s,HUPO)的人类蛋白质组计划(HPP,Human Proteome Project)。截至2022年3月,HPP已经发现了93.2%的人类蛋白质组(18 407个蛋白质),估计人类基因组编码19 750个蛋白质。

    Wilkins是HUPO的理事会成员,他没有正式参与HPP,他说:“好消息是,我们可以从基因组中某种程度上预测出应该在人类蛋白质组中的蛋白质数量。”

    统计蛋白型数量(Proteomform)是一项更大的挑战,因为蛋白质型比编码的蛋白质要多得多。截至目前,人类蛋白质型项目(Human Proteoform Project)截至2022年8月已识别出61 770种蛋白型。但这还远远没有达到蛋白型的总数。“从根本上说,我们正在讨论的是在5000万到1亿种独特的蛋白质形式上定义某种东西,”Kelleher说,他是人类蛋白质形式项目(Human Proteoform Project)的带头人,也是自上而下(Top-Down)蛋白质组学联盟(Consortium for Top-Down Proteomics)的董事会主席。

    今天与明天

    目前,已经有一些努力和尝试提供了可用的蛋白质数据结果。人类蛋白质图谱(Human Protein Atlas)是一个开放获取的蛋白质数据库,其中蛋白质表达的定量数据是包含许多基于抗体与抗体染色图像的信息。UniProt和neXtProt平台也会发布蛋白质的信息,然而跟踪哪些蛋白质仍然需要进一步的研究,比如那些功能未知的蛋白质。

    开源人工智能系统AlphaFold预测了大多数被认为存在于地球上的蛋白质的结构(超过2亿种)。当研究人员输入一个蛋白质序列时,AlphaFold会吐出一个预测的结构。这一点尤其重要,因为蛋白质的结构会影响其功能。

    “AlphaFold非常有帮助……我们也在使用它,”Nita-Lazar说,他也是美国国家过敏和传染病研究所国家细胞网络蛋白质组单位的高级研究员,也是HUPO的生物学和疾病驱动的人类蛋白质组项目(Biology & Disease-Driven Human Proteome Project)的执行委员会成员。“它具有很强的互动性和合作性。”

    目前有一个开放获取的结构数据库(open access database)可以访问。不过,这些预测的结构仍然只是预测。但据研究人员所知,蛋白质组学有可能应用到其他领域,包括医学。例如,基于蛋白型的检测实验(proteoform-based assay)可以确定患者感染细菌的种类。

    蛋白质组学分析也被用于其他疾病的研究。错误折叠的蛋白质会导致被称为蛋白质病的蛋白质疾病,包括阿尔茨海默病和帕金森病。一些研究检查了阿尔茨海默病患者大脑中的蛋白质组学变化。

    蛋白质组学的另一个应用领域是癌症研究:2011年,美国国立癌症研究所建立了临床蛋白质组学肿瘤分析联盟(Clinical Proteomic Tumor Analysis Consortium,CPTAC),通过蛋白质组学(一种将蛋白质组学和基因组学结合起来的方法)更好地了解癌症。德克萨斯大学MD安德森癌症中心也有一个癌症蛋白质组学的研究平台,希望它能推进旨在提高癌症生存率的登月计划。

    “蛋白质组学领域的每个人都站在彼此的肩膀上,”Wilkins说。“看到这么多不同方法的人聚在一起,试图实现这一切,是一件很奇妙的事情。”

    相关文章

      网友评论

          本文标题:后基因组——蛋白质组学简史

          本文链接:https://www.haomeiwen.com/subject/fthirltx.html