无应力结构松弛能的图神经网络学习中的数据增强

摘要:计算材料发现在过去十年中得到了不断的发展,这要归功于计算能力和晶体结构预测算法(CSPA)的进步。然而,CSPA所需的从头计算的计算成本限制了其在小单元胞中的应用,降低了算法可以探索的组成和结构空间。过去的研究通过利用机器学习方法来预测形成能量和确定材料的稳定性,绕过了许多不需要的从头计算。具体来说,图神经网络在预测形成能量方面显示出很高的准确性。传统的图神经网络是在大量松弛结构的数据集上进行训练的。不幸的是,CSPA生成的未被松弛的候选结构的几何形状通常与松弛状态有所偏差,这导致了预测的不准确,从而影响了模型在从头计算之前过滤不利于能量的结构的能力。该研究表明,在训练过程中,松弛结构的预测误差减小,而未松弛结构的预测误差增加,这表明松弛与未松弛结构的预测准确性存在反相关。为了解决这个问题,我们提出了一个简单、物理上合理、计算成本低廉的扰动技术,通过增加训练数据来显著改善对未松弛结构的预测。在由623个Nb-Sr-H氢化物结构组成的测试集上,我们发现通过使用我们的增强方法训练晶体图卷积神经网络,与仅使用松弛结构训练相比,形成能量预测的MAE减小了66\%。然后,我们展示了这种误差减小如何通过提高模型准确地过滤掉不利于能量的结构来加速CSPA的过程。

作者:Jason B. Gibson, Ajinkya C. Hire, Richard G. Hennig

论文ID:2202.13947

分类:Computational Physics

分类简称:physics.comp-ph

提交时间:2022-03-01

PDF 下载: 英文版 中文版pdf翻译中