基于深度学习的距离驱动蛋白质折叠

摘要:蛋白质的联系辅助折叠取得了很大进展,但仍然存在两个挑战。一个是在缺乏许多序列同源物的蛋白质中准确预测联系,另一个是通常需要耗费时间的折叠模拟来预测从预测的联系中得到好的三维模型。我们展示了蛋白质距离矩阵可以被深度学习很好地预测,并且可以直接用于构建三维模型,而无需进行任何的折叠模拟。使用距离几何法从我们预测的距离矩阵中构建三维模型,在20个CPU的Linux计算机上,在4小时内成功折叠了37个CASP12难目标中的21个,其中中位数家族规模为58个有效序列同源物。相比之下,直接耦合分析(DCA)所预测的联系在没有折叠模拟的情况下无法折叠任何一个目标,而最好的CASP12团队通过将预测的联系整合到复杂的基于片段的折叠模拟中成功折叠了其中的11个目标。在对15个CASP13目标进行严格实验验证时,我们基于距离的折叠服务器成功折叠了2个大型目标(序列同源物小于150)中的2个,而其他服务器在这三个目标上都失败了,并且我们的ab initio折叠服务器还预测出了一个大型同源建模目标的最佳高质量三维模型。在CAMEO中进行进一步的实验验证显示,我们的ab initio折叠服务器在一个具有200个残基和229个序列同源物的新折叠的膜蛋白上预测出了正确的折叠,而其他所有服务器都失败了。这些结果表明,深度学习为个人计算机上的ab initio折叠提供了一种高效准确的解决方案。

作者:Jinbo Xu

论文ID:1811.03481

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2022-10-12

PDF 下载: 英文版 中文版pdf翻译中