面向大分子的线性扩展和化学准确的全局机器学习力场

摘要:机器学习力场(MLFFs)逐渐发展为能够以Ab initio精度进行分子和材料的分子动力学模拟,但计算成本仅为一小部分。然而,要实现对真实分子的预测性MLFF模拟,仍需解决几个挑战,包括:(1)开发用于非局部原子间相互作用的高效描述符,这对于捕捉长程分子波动至关重要,以及(2)减少核方法中描述符的维度(或神经网络中的参数数量),以增强MLFF的适用性和可解释性。在这里,我们提出了一种自动化方法,可以大大减少原子间描述符特征的数量,同时保持MLFF的准确性并增加效率。为了同时解决这两个挑战,我们以全球GDML MLFF为例说明了我们的方法;然而,我们的方法也同样适用于其他模型。我们发现,在肽链、DNA碱基对、脂肪酸和超分子复合物等研究系统中,非局部特征(原子间距高达15$~\mathring{A}$)对于保持MLFF的整体准确性至关重要。有趣的是,在减少的描述符中所需的非局部特征数量与局部原子间特征的数量(距离在5$~\mathring{A}$以下)相当。这些结果为构建全局分子MLFF铺平了道路,其成本随系统规模的增加是线性的,而不是二次的。

作者:Adil Kabylda, Valentin Vassilev-Galindo, Stefan Chmiela, Igor Poltavsky, Alexandre Tkatchenko

论文ID:2209.03985

分类:Chemical Physics

分类简称:physics.chem-ph

提交时间:2023-04-13

PDF 下载: 英文版 中文版pdf翻译中