自动编码器用于分子动力学中的维度约简:集体变量维度、偏置和转换态
摘要:热休克蛋白90(Hsp90)是一种分子伴侣,在ATP水解的游离能量作用下控制客体蛋白的折叠和激活。Hsp90的活性位点位于其N端域(NTD)。我们的目标是利用自动编码器学习的集体变量(CV)结合自适应偏置力(ABF)Langevin动力学来表征NTD的动态性。使用二面角分析,我们对所有可用的实验Hsp90 NTD结构进行聚类,得到不同的本地态。然后,我们进行无偏分子动力学(MD)模拟,构建一个代表每个态的数据集,并使用该数据集来训练自动编码器。考虑了两种自动编码器架构,分别为具有一个和两个隐藏层,瓶颈维度$k$的范围从1到10。我们证明了额外隐藏层的添加并没有显著提高性能,而是导致复杂的CV,增加了有偏MD计算的计算成本。此外,2D瓶颈可以提供足够的不同状态信息,而最佳瓶颈维度是五。对于2D瓶颈,二维CV直接用于有偏MD模拟。对于5D瓶颈,我们对潜在CV空间进行分析,找出最能分离Hsp90状态的CV坐标对。有趣的是,从5D CV空间中选择一个2D CV比直接学习一个2D CV获得更好的结果,并且允许在进行自由能有偏动力学时观察本地态之间的转换。
作者:Zineb Belkacemi, Marc Bianciotto, Herve Minoux, Tony Lelievre, Gabriel Stoltz, Paraskevi Gkeka
论文ID:2306.02935
分类:Computational Physics
分类简称:physics.comp-ph
提交时间:2023-07-26