蛋白质二级结构:熵、相关性与预测

摘要:蛋白质的二级结构主要由沿氨基酸骨架相邻残基之间的局部相互作用决定,还是由非局部三级相互作用决定?为了回答这个问题,我们测量了一级结构和二级结构序列的熵密度,以及局部序列间相互信息密度。我们发现重要的序列间相互作用是短程的,相邻氨基酸之间的相关性基本上是无信息的,并且只有1/4的用于确定二级结构的总信息来自局部序列间相关性。由于剩下的信息必须来自非局部相互作用,这个观察结果支持了大多数蛋白质通过合作过程形成二级和三级结构的观点。为了与现有的二级结构预测方法进行更直接的比较,我们构建了一个简单的隐马尔可夫模型(HMM)来预测序列。这个HMM的预测准确率与其他单序列二级结构预测算法相当,并且可以提取出几乎所有的序列间相互信息。这表明这些算法几乎是最优的,我们不应该期望预测准确度有大幅度的提高。然而,在许多三级结构预测方法(如靠线索预测)中,二级结构和一级结构之间的局部相关性可能被低估了重要性。

作者:Gavin E. Crooks, Steven E. Brenner

论文ID:q-bio/0310034

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中