蛋白质-配体结合亲和力的代数图学习

摘要:代数图论模型在物理建模和分子研究中已经得到了广泛应用,但与其他定量方法相比,它们在分析和预测生物分子性质方面通常无能为力。有必要探索代数图论在分子和生物分子建模、分析和预测方面的能力和限制。在这项工作中,我们提出了一种新颖的代数图学习(AGL)模型,该模型将高维的物理和生物信息编码成固有的低维表示。所提出的AGL模型引入了多尺度加权彩色子图,通过与图拉普拉斯矩阵、其伪逆和邻接矩阵相关的图不变量描述关键的分子和生物分子相互作用。此外,AGL模型与先进的机器学习算法相结合,将生物分子结构的低维图表示与宏观性质相连接。我们使用了三个常用的蛋白质-配体结合亲和性基准数据集,即CASF-2007、CASF-2013和CASF-2016,来验证目前AGL模型的准确性、鲁棒性和可靠性。数值结果表明,所提出的AGL方法在蛋白质-配体复合物的结合亲和性预测方面优于其他最先进的方法。

作者:Duc Duy Nguyen, Guo-Wei Wei

论文ID:1812.08328

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2018-12-21

PDF 下载: 英文版 中文版pdf翻译中