洛斯阿拉莫斯国家实验室、北卡罗来纳大学教堂山分校和佛罗里达大学的最新研究表明,人工神经网络可以被训练成编码量子力学定律来描述分子的运动,这可能会在大范围的领域进行超级模拟。
洛斯阿拉莫斯实验室理论部门的物理学家、大都会研究员贾斯汀·史密斯(Justin Smith)说:这意味着我们现在可以比传统量子方法更快地对材料和分子动力学进行建模,同时保持同样的精确度。
了解分子如何运动对于开发药物、蛋白质模拟和反应化学等潜在价值至关重要,量子力学和实验(经验)方法都可以应用到模拟中。这项被称为ANI-1ccx势的新技术,有望提高许多领域研究人员的能力,并在未来的金属合金和爆炸物理研究中提高基于机器学习势的准确性。量子力学(QM)算法用于经典计算机,能够准确地描述化合物在其运行环境中的力学运动。但是量子力学在不同分子大小的情况下很难扩展,这严重限制了可能的模拟范围。在模拟中,即使分子大小稍有增加,也会极大地增加计算负担。
因此,从业人员经常求助于使用经验信息,这些经验信息根据经典物理学和牛顿定律描述原子运动,使模拟能够扩展到数十亿个原子或数百万种化合物。传统上,经验势必须在准确性和可转让性之间进行权衡。当对一种化合物的许多电势参数进行微调时,对其他化合物的准确度就会下降。相反,洛斯阿拉莫斯团队与北卡罗来纳大学教堂山分校和佛罗里达大学合作。开发了一种名为“转移学习”(transfer learning)的机器学习方法。
通过从收集到的数百万其他化合物数据中学习,可以建立经验潜力。这种具有机器学习经验潜力的新方法可以在几毫秒内应用于新分子,从而在更长的时间尺度内研究更多化合物。化学和生物系统原子分辨率的计算模型,是化学家工具集中的一个重要工具。计算机模拟的使用需要在成本和精度之间取得平衡:量子力学方法提供了很高的精度,但计算成本高,而且对大型系统的伸缩性较差,而经典力场成本低且可伸缩,但缺乏对新系统的可移植性。
机器学习人工神经网络可以用来实现这两种方法的最佳效果。研究人员训练一个通用的神经网络电位(ANI-1ccx),它接近CCSD(T)/CBS在反应热化学、异构化和类药物分子扭转的基准上的准确性。这是通过训练一个网络到DFT数据,然后使用传输学习技术在一个黄金标准QM计算(CCSD(T)/CBS)数据集上进行再训练来实现,该数据集最优地跨越了化学空间。由此产生的潜力广泛应用于材料科学、生物学和化学,比CCSD(T)/CBS计算快数十亿倍。
网友评论