美文网首页文献学习(分子模拟)
【ZT】Rarey小组JCIM论文:生成小分子构象集合的新算法C

【ZT】Rarey小组JCIM论文:生成小分子构象集合的新算法C

作者: 爱折腾的大懒猪 | 来源:发表于2019-03-30 22:42 被阅读1次

    文章来源:微信公众号 - ComputArt计算有乐趣 2019-3-30

    许多计算机辅助药物设计的方法都需要建立构象集合(conformer ensembles)来对小分子的自由度进行处理,例如分子对接、药效团搜索、三维数据库搜索和构建三维定量构效关系模型等。但是,产生具有代表性的构象集合并不是件容易的事情。目前存在基于各种算法的软件用于生成小分子构象。近日,来自德国Hamburg大学M. Rarey小组和挪威Bergen大学J. Kirchmair小组的研究人员比较了7种学术软件和8种商业软件的性能1,2。结果表明所测试的每款学术软件生成的分子构象都存在一些严重的键长、键角的错误以及非平面形变,其精确性与鲁棒性明显低于商业软件输出的结果。为了克服这个问题,作者发展了一种新的构象生成软件Conformator3。

    图1、Conformator流程图

    Conformator是一种建立在CONFECT算法4基础上的基于知识的构象生成算法,如图1。它能够读取SD、MOL2格式的文件及SMILES、InChI字符串并将其转化成一系列3D原子坐标,从而得到原子和键的规范化顺序。通过解析,conformator将识别到的非环及非端基单键匹配以相应的扭转角,键角的选择遵循VSEPR模型。键长用共价键半径之和计算,并根据原子类型和分子环境进行调整4。接下来conformator将通过迭代过程不断地移除扭转角直到构象集值低于阈值。该操作的目的是将在聚类过程中产生及分析的构象减少2-3个数量级。随后的构象生成过程遵循标准增量构建法5(standard incremental construction approach),优先生成最相关的构象,并利用CANON算法6的变形对对称的构象进行规避。至于环结构,conformator中小于9个碳的环用NAOMI7的环模板数据库(ring template library)进行处理。而大于9个碳的环将通过预处理、构象生成、重建等步骤得到大环坐标,从而与非环构象一同进行接下来的构象聚类和输出。
    与CONFECT相比conformator的亮点在于:1)对大环构象采样的新方法。该算法鲁棒性强、适用范围广、并利用了复杂的非环构象生成技术,采用新型数值优化器(numeric optimizer)与可微打分函数(differentiable scoring function)MCOS联合操作,即使在复杂的大环体系中也能产生低能量的构象。2)高效的聚类新算法,它是coformator算法的最后一步,意在利用“按顺序生成的构象结构高度相似”这一事实,来减少相似构象间相互比较的计算量。3)对于扭转角采样规则的拓展,通过迭代过程不断地移除扭转角直到构象集值大于阈值。这一操作使将要在聚类过程中产生及分析的构象减少了2-3个数量级。4)对SMILES和InChI输入符性能的处理。以及Guba等人对扭转角数据库(torsion angle library)的修正与扩充8。这些改进使得conformator成为一个在输入格式、分子几何结构以及大环处理等方面鲁棒性突出的高精度、高效能的算法。该项工作最近发表在美国化学会出版的Journal of Chemical Information and Modeling杂志上(J. Chem. Inf. Model. 2019, 59, 731−742)。

    图2、conformator与其他算法的关键性能比较

    接下来作者将conformator,CONFECT以及学术软件中性能最好的RDKit DG和商业软件中性能最好的OMEGA进行了性能上的对比评估。结果显示,当最大ensemble size为250时,best conformator的RMSD中值为0.47 Å,ensemble size为187。即使在ensemble size上稍有逊色,但best conformator在准确性上明显好于RDKit DG。在与商业算法OMEGA的比较中,两者的RMSD中值分别为0.47 Å和0.46 Å,可以看出其区别并不显著,而二者的ensemble size却相差甚远,OMEGA的ensemble size为74,还不到best conformator的一半(最大ensemble size为50时所得结论与250时基本相同)。紧接着作者又对旋转键的数目与ensemble size及RMSD等参数之间的关系做了进一步研究,得出“对于含有5个及以上可旋转键的分子,在ensemble size较低的情况下,conformator的性能更好“等一系列相关结论。

    图3、geldanamycin的构象。3a) Sperrylite数据库中用于验证conformator的构象,3b) geldanamycin的2D结构,3c)通过best conformator生成的构象集与原始构象的叠合,3d)构象集合中的最优构象与原始构象的叠合.

    为了进一步验证conformator的性能,作者选取经典的大环化合物(geldanamycin)-蛋白质分子结合模型进行模拟,他们从Sperrylite数据集9中选取了49个至少含一个大环的化合物,并利用conformator进行构象集合的生成。结果表明,conformator达到了与OMEGA相当的精度和效能,其在保持整体ensemble size较低的情况下,对于由5个或更多可旋转键组成的分子性能最好。与免费算法相比,conformator明显占优,是唯一一个没有在所生成的构象中检测到明显几何误差的算法。它不仅对输入的2D,3D结构都具有可操作性,而且不使用PDB数据来推导几何参数(键长,键角,角张力,环构象等)。这些优势将使得conformator在未来得到更加广泛应用。

    参考文献:

    1. Friedrich, N.-O.; Meyder, A.; de Bruyn Kops, C.; Sommer, K.;Flachsenberg, F.; Rarey, M.; Kirchmair, J. High-Quality Dataset ofProtein-Bound Ligand Conformations and Its Application to Benchmarking Conformer Ensemble Generators. J. Chem. Inf. Model. 2017, 57, 529−539.
    2. Friedrich, N.-O.; de Bruyn Kops, C.; Flachsenberg, F.; Sommer, K.; Rarey, M.; Kirchmair, J. Benchmarking Commercial Conformer Ensemble Generators. J. Chem. Inf. Model. 2017, 57, 2719−2728.
    3. Friedrich NO, Flachsenberg F, Meyder A, Sommer K, Kirchmair J, Rarey M. Conformator: A Novel Method for the Generation of Conformer Ensembles. J Chem Inf Model. 2019, 59(2), 731-742.
    4. Schärfer, C.; Schulz-Gasch, T.; Hert, J.; Heinzerling, L.; Schulz, B.; Inhester, T.; Stahl, M.; Rarey, M. CONFECT: Conformations from an Expert Collection of Torsion Patterns. ChemMedChem 2013, 8, 1690−1700.
    5. Rarey, M.; Kramer, B.; Lengauer, T.; Klebe, G. A Fast Flexible Docking Method Using an Incremental Construction Algorithm. J. Mol. Biol. 1996, 261, 470−489.
    6. Weininger, D.; Weininger, A.; Weininger, J. L. SMILES. 2. Algorithm for Generation of Unique SMILES Notation. J. Chem. Inf. Model. 1989, 29, 97−101.
    7. Urbaczek, S.; Kolodzik, A.; Fischer, J. R.; Lippert, T.; Heuser, S.; Groth, I.; Schulz-Gasch, T.; Rarey, M. NAOMI: On the Almost Trivial Task of Reading Molecules from Different File Formats. J. Chem. Inf. Model. 2011, 51, 3199−3207.
    8. Guba, W.; Meyder, A.; Rarey, M.; Hert, J. Torsion Library Reloaded: A New Version of Expert-Derived SMARTS Rules for Assessing Conformations of Small Molecules. J. Chem. Inf. Model. 2016, 56, 1−5.
    9. Friedrich, N.-O.; Simsir, M.; Kirchmair, J. How Diverse Are the Protein-Bound Conformations of Small-Molecule Drugs and Cofactors? Front. Chem. 2018, 6, 68.
    想了解更多CADD最新进展? 请关注专业的公众号: ComputArt计算有乐趣

    相关文章

      网友评论

        本文标题:【ZT】Rarey小组JCIM论文:生成小分子构象集合的新算法C

        本文链接:https://www.haomeiwen.com/subject/rcjebqtx.html