使用预训练的分子表示评估结构-性质关系的粗糙度

摘要:化学的“基础模型”最近才通过自我监督学习从未标记的样本中学习分子表示方法。然而,与基准方法相比,这些预训练表示在性质预测基准测试中的表现参差不齐。我们希望通过研究底层QSPR曲面的粗糙度来理解这些趋势。我们引入了粗糙度指标(ROGI)的改进版本ROGI-XD,以便可以比较不同表示方法的ROGI值,并评估各种预训练表示方法以及通过简单指纹和描述符构建的表示方法。结果显示,预训练表示方法无法产生更平滑的QSPR曲面,与先前的实证结果一致。我们的发现表明,在模型预训练期间,对于分子结构的平滑性施加更强的假设可以有助于生成更平滑的QSPR曲面。

作者:David E. Graff, Edward O. Pyzer-Knapp, Kirk E. Jordan, Eugene I. Shakhnovich, Connor W. Coley

论文ID:2305.08238

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2023-05-16

PDF 下载: 英文版 中文版pdf翻译中