接触矩阵和蛋白质中的疏水性特征的主要特征向量

摘要:蛋白质序列和其原生结构之间的关系的研究:一种基于序列和结构的向量表示方法研究蛋白质序列和其原生结构之间的关系。结构表示依赖于折叠接触矩阵的主特征向量(PE)。最近的研究表明,后者编码了重建整个接触矩阵所需的足够信息。序列通过亲疏水性轮廓(HP)来表示,使用我们从残基-残基相互作用矩阵的主特征向量中获得的广义亲疏水性尺度来实现。使用这种新的尺度,我们定义了蛋白质折叠的最佳HP,并通过稳定性论证预测,它与折叠接触矩阵的PE之间存在强相关性。这一预测通过进化分析得到了证实,该分析显示PE与采用相同折叠的每个单个序列的HP之间存在相关性,并且与这组序列的平均HP之间的相关性更强。因此,蛋白质序列进化的方式使其平均HP接近最佳HP,这意味着中性进化可以被看作在最佳HP周围的序列空间中的一种运动。我们的结果表明,N维向量之间的相关系数构成了向量空间中的自然度量,我们将其称为向量蛋白质空间。这样,我们为序列到序列、序列到结构和结构到结构之间的对齐定义了一个统一的框架。我们还展示了互动尺度在序列与序列以及序列与结构之间比较方面几乎是最佳的。

作者:Ugo Bastolla, Markus Porto, H. Eduardo Roman, and Michele Vendruscolo

论文ID:q-bio/0406003

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中