奥卡姆剃刀原理在人工智能中的应用:化学空间中基于哈默特激发产物近似的粗粒化方法

摘要:数据需求量大的机器学习方法已经成为分子和材料设计和发现中有效导航化学化合物空间的新标准。然而,由于高质量实验或合成模拟训练数据稀缺和代价高昂,数据获取成本可能相当大。依靠具有低计算复杂性的相对准确的近似基线标签,是削减数据需求的最有效策略之一,例如通过 Delta、转移或多信度学习。我们引入了一种基于一般粗粒化 Hammett Inspired Product (HIP) 的基线标签,该标签将经验Hammett公式推广到任意系统和性质。HIP的适用性的数值证据包括分子的溶剂化自由能、四元elpasolite晶体的形成能、多孔催化表面上的碳吸附能、金属有机配合物的HOMO-LUMO能隙以及S_N2反应的活化能。在相同的训练集上进行校准后,HIP为改进的Delta-量子机器学习模型提供了一个有效的基线,具有比之前引入的专门领域特定模型更高的数据效率。

作者:Marco Bragato, Guido Falk von Rudorff, O. Anatole von Lilienfeld

论文ID:2305.07010

分类:Chemical Physics

分类简称:physics.chem-ph

提交时间:2023-05-12

PDF 下载: 英文版 中文版pdf翻译中