LAST:蛋白质轨迹的潜空间辅助自适应采样

摘要:蛋白质构象和动力学的研究广泛使用分子动力学(MD)模拟。然而,传统模拟容易被困在难以逃脱的局部能量极小值中。因此,大部分计算时间都花在已经访问过的区域中采样。这导致了采样过程低效,进一步阻碍了在可负担的模拟时间内探索蛋白质的运动。深度学习的进步为蛋白质采样提供了新的机会。变分自动编码器是一类深度学习模型,可学习一个低维表示(称为潜在空间),可以捕捉输入数据的关键特征。基于这个特性,我们提出了一种新的自适应采样方法,即潜在空间辅助自适应采样蛋白质轨迹(LAST),以加速蛋白质构象空间的探索。这种方法包括以下循环:(i)变分自动编码器训练,(ii)在潜在空间中选择种子结构,以及(iii)通过额外的MD模拟进行构型采样。通过对两个蛋白质系统(E. Coli腺苷激酶(ADK)的两个亚稳态和Vivid(VVD)的两个原生态)的四种结构进行采样,验证了所提出的方法。在所有四种构型中,种子结构都显示为处于构象分布的边界上。此外,与传统MD(cMD)模拟相比,在较短的模拟时间内观察到了较大的构象变化。在ADK亚稳态模拟中,LAST探索了两个向两个稳态的转变路径,而cMD则被困在一个能量盆地中。在VVD亮态模拟中,LAST比cMD模拟快三倍,且具有类似的构象空间。

作者:Hao Tian, Xi Jiang, Sian Xiao, Hunter La Force, Eric C. Larson, Peng Tao

论文ID:2204.13040

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2022-04-28

PDF 下载: 英文版 中文版pdf翻译中