可靠的自动蛋白质结构对齐探索

摘要:结构相似性计算中已经提出了各种方法,称为结构对齐或叠加。目前结构对齐算法的一个主要缺点在于其内在设计是基于局部结构相似性。在本文中,我们提出了一种方法,将全局信息纳入到获得最佳对齐和叠加中。我们的方法在优化TM分数和GDT分数时,产生的结果明显优于当前最先进的蛋白质结构对齐工具。具体来说,如果TMalign找到的最高TM分数低于0.6,而被测试方法中的某一个找到的最高TM分数高于0.5,那么使用TMalign找到TM分数高于0.5的概率为42\%,而使用我们的方法则降低到2\%。这可以显著提高蛋白质折叠检测的准确性,如果使用截断TM分数为0.5。 此外,现有的结构对齐算法仅关注结构相似性,忽略了其他重要的相似性,如序列相似性。我们的方法可以将多个相似性纳入评分函数。结果显示,序列相似性有助于找到高质量的蛋白质结构对齐,这些对齐与HOMSTRAD中的目视对齐更一致。即使结构相似性本身无法找到与目视对齐一致的对齐,我们的方法仍能够找到与目视对齐高度相似甚至完全相同的对齐。

作者:Xuefeng Cui, Shuai Cheng Li, Dongbo Bu, and Ming Li

论文ID:1307.7798

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2013-07-31

PDF 下载: 英文版 中文版pdf翻译中