使用机器学习从低水平量子力学计算中高度准确地预测NMR化学位移
摘要:从第一原理预测核磁共振(NMR)化学位移可以极大地促进实验解释和结构鉴定。然而,使用最佳耦合簇方法准确预测化学位移对于今天的计算机而言,在非氢原子数超过10到20个的系统中可能是不可承受的昂贵。相比之下,机器学习方法提供了低成本的替代方案,但在原始训练集之外的分子中的泛化能力受限。在这里,我们提出了一种新颖的机器学习特征表示方法,该方法利用廉价的量子力学方法在分子环境中进行原子化学屏蔽张量的中间计算,并训练其预测与CCSD(T)在完备基组极限下可比较的高级复合理论的NMR化学屏蔽。然后,采用一种新的渐进式主动学习工作流程训练了低成本位移机器学习(iShiftML)算法,该流程在构建数据集时减少了所需的昂贵计算总数,同时允许模型在未曾见过的数据上持续改进。此外,我们还展示了我们模型的误差估计与实际误差非常相关,可以为新的预测提供置信度值。我们通过研究小有机分子的气相实验化学位移以及更大更复杂的天然产物使iShiftML的预测能力得到了展示,我们可以准确区分基于化学位移分配的微小异构体。
作者:Jie Li, Jiashu Liang, Zhe Wang, Aleksandra L. Ptaszek, Xiao Liu, Brad Ganoe, Martin Head-Gordon, Teresa Head-Gordon
论文ID:2306.08269
分类:Chemical Physics
分类简称:physics.chem-ph
提交时间:2023-06-16