噪声对反向设计的影响:核磁共振谱匹配案例

摘要:从核磁共振(NMR)测量中推导出化学结构一直以来都是一项手动且耗时的工作,尽管在有机化学领域对于评估反应成功具有基本重要性并被广泛使用。为了跟上自动合成在自动化实验室环境中的加速步伐,需要强大的计算算法来快速执行结构解析。我们通过系统限制化学搜索空间并相应减少匹配任务的模糊性,分析在逆向结构解析问题中遇到的NMR谱匹配任务的解决效果。对QM9-NMR数据库中最常见的20种化学计量的数值证据表明,在受限搜索空间中更允许机器学习预测误差的系统趋势。结果表明,含有多个杂原子的化合物比其他化合物更难表征。通过将QM9扩展为通过Surge,ETKDG和CREST生成的3D结构生成的约10倍的构型异构体,我们使用在QM9-NMR数据上训练的化学位移的机器学习模型来测试谱匹配算法。在匹配过程中同时使用$^{13}mathrm{C}$和$^{1}mathrm{H}$化学位移比仅基于$^{13}mathrm{C}$位移的匹配提供了两倍的机器学习预测误差容忍度。性能曲线表明,减少模糊性和搜索空间可以将机器学习训练数据需求减少数个数量级。

作者:Dominik Lemm, Guido Falk von Rudorff, O. Anatole von Lilienfeld

论文ID:2307.03969

分类:Chemical Physics

分类简称:physics.chem-ph

提交时间:2023-07-18

PDF 下载: 英文版 中文版pdf翻译中