蛋白质多序列比对中使用列组的协方差

摘要:基于分析多个序列比对中的列对之间的协变关系的算法常用于预测功能重要残基和结构接触。然而,协变仅出现在蛋白质的个别残基之间的假设更多是出于计算方便而非蛋白质基本结构的原因。在这里,我们开发了一种新颖的算法,它定义了两组列之间的协变得分,其中每组代表比对中一段连续的列。我们定义了一个测试集,其中包括超过1,100个PFAM家族的二级结构元件(α-螺旋和β-折片)。通过使用这些比对来预测在结构上相互接近的片段,我们展示了我们的方法明显优于仅合并操作于个别列对的算法结果的方法。我们的方法表明,考虑蛋白质的更大单位除了列对之间可以提高协变算法的效力和实用性。

作者:Kyle E. Kreth and Anthony A. Fodor

论文ID:1401.1141

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2014-01-07

PDF 下载: 英文版 中文版pdf翻译中