从组合蛋白质文库推断相互作用

摘要:通过体外组合方法创建的蛋白质是理解序列-结构-功能关系的重要信息来源。将组合文库中折叠蛋白质的序列进行比对分析可以利用已开发用于自然产生的蛋白质的方法,但这忽略了库中未折叠序列所包含的信息。我们引入了两种算法,逻辑回归和过剩信息分析,它们同时使用折叠和未折叠的序列,并将它们与只使用前者的条件表和统计相关性分析进行比较。对于这个基准研究的测试集来说,它是一个根据假设的能量模型进行折叠的虚构蛋白质文库。在研究的四种方法中,只有逻辑回归能够从序列比对中正确重现能量模型。其他算法预测了在蛋白质稳定性上有强烈但个别影响的比对位置之间的虚假相互作用。当这些稳定氨基酸出现在同一蛋白质中时,其频率会降低能量低于折叠所需的阈值。因此,即使位置不相互作用,它们在比对中的频率也可能相关。我们认为任何忽略折叠和能量之间的非线性关系的算法都容易出现这种错误。

作者:Jeffrey B. Endelman, Jesse D. Bloom, Christopher R. Otey, Marco Landwehr and Frances H. Arnold

论文ID:q-bio/0505018

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中