蛋白质结构预测的分布估计算法
摘要:蛋白质的结构对于维持生命至关重要。例如,通过了解蛋白质的结构,可以建立细胞调控机制的模型,支持疾病治疗方法的开发或者理解蛋白质结构与食品特性之间的关系。然而,发现蛋白质的结构是一项困难且昂贵的任务,因为很难探索大范围的搜索来预测甚至一个小蛋白质。基于模板的方法(粗粒化、同源、扩展等)依赖于先前的蛋白质相关知识(PK),这些知识是使用其他方法(如X射线晶体学或核磁共振)确定的。另一方面,无模板的方法(全原子和自发)依赖于原子的物理-化学性质来预测蛋白质的结构。与其他方法相比,分布估计算法(EDA)可能需要更少的PK,这表明它可能适用于具有较低PK水平的蛋白质。找到一个既能处理预测质量又能计算时间的EDA是一项困难的任务,因为它们之间强烈相关。我们开发了一种特定于全原子表示的自发蛋白质结构预测(PSP)问题的EDA。我们开发了一种单变量和两种双变量的概率模型,以设计一个适当的EDA用于PSP。双变量模型在氨基酸内部的二面角$phi$和$psi$之间建立了关系。此外,我们将所提出的EDA与文献中的其他方法进行了比较。我们注意到,即使是一个相对简单的算法,如随机行走,也可以找到正确的解决方案,但它需要大量的先前知识(有偏倚的预测)。另一方面,我们的EDA能够在没有任何先前知识的情况下正确预测,从而将这种预测描述为纯自发预测。
作者:Daniel Bonetti, Alexandre Delbem, Dorival Le~ao, Jochen Einbeck
论文ID:1901.01059
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2019-01-07