Robust deep learning–based protein sequence design using ProteinMPNN”和“Hallucinating symmetric protein assemblies
虽然深度学习使蛋白质结构预测发生了革命性的变化,但几乎所有实验表征的从头蛋白质设计都是使用基于物理的方法(如 Rosetta)生成的。在这里,我们描述了一种基于深度学习的蛋白质序列设计方法,ProteinMPNN,它在计算机和实验测试中都有优异的性能。在天然蛋白质骨架上,蛋白质 MPNN 的序列回收率为52.4% ,而 Rosetta 的序列回收率为32.9% 。不同位置的氨基酸序列可以在单链或多链之间偶联,使其能够应用于当前蛋白质设计的广泛挑战。我们利用 X光散射技术、冷冻电镜和功能研究,通过挽救以前失败的蛋白质单体、环状高聚物、四面体纳米颗粒和靶结合蛋白的设计(使用 Rosetta 或 AlphaFold) ,展示了蛋白质 MPNN 的广泛实用性和高准确性。
结果显示,ProteinMPNN的序列回收率为52.4%,具有广泛的实用性和高准确性。
Hallucinating symmetric protein assemblies
环状蛋白低聚物在几乎所有的生物过程中都起着关键作用,占蛋白质数据库(PDB)中所有沉积结构的近30% (1-4)。由于环状蛋白低聚物的许多应用,从小分子结合和催化到纳米笼装配的构建块(5) ,这种结构的从头设计从蛋白质设计领域开始就引起了相当大的兴趣(6,7)。虽然已经取得了一些成功(8-10) ,目前的方法通常需要提前说明原体的结构。除了参数化设计的结构(11,12)之外,设计策略涉及将特征单体的刚体对接成高阶对称结构,然后进行界面优化以产生低能量组装状态(13-17)。提前指定原体结构的要求限制了对低聚物结构的全部空间的探索,例如具有更多交织链的组装。对于单体蛋白质设计来说,深度网络幻觉使得对可能结构空间的广泛探索成为可能: 从一个随机的氨基酸序列开始,有利于折叠到一个明确定义状态的马尔科夫蒙特卡洛(MCMC)优化收敛于新的序列,折叠到新的结构(18-21)。通过推广,我们推断深度网络幻觉可以在一步中设计高阶蛋白质组装,而不需要预先规范或实验证实原体的结构,只要可以制定适当的损失函数,指定原体折叠和组装(18-20,22-25)。
两项研究成果表明,机器学习可以用于创建蛋白质分子,且更加准确快速。
网友评论