多维互信息方法在多序列比对的协变性分析中的应用
摘要:多序列比对(MSA)中可用于检测共变位置的方法有几种。如果MSA包含大量序列,则从共变图中得出的残基之间的接近性信息足以预测蛋白质的折叠形式。如果蛋白质的结构已知,则与共变位置相关的信息对于理解蛋白质的机制是有价值的。本研究旨在确定传统互信息(MI)的多元扩展是否可以是研究共变的额外工具。采用两种去除三元/四元相互依赖效应的多维MI(mdMI)方法对一组包含<400个序列的MSA进行了测试,结果显示其性能与基于最大熵/伪似然统计模型的蛋白质序列方法相当。然而,虽然所有测试方法在参考X射线结构中检测到的与<8个残基分开的共变对的数量相似,但不同原理的方法之间的最高评分对之间的重叠率平均低于65%。我们还尝试确定方法之间性能差异是否是由于去除了链状结构联系的不同效率。我们发现,得出MSA列之间的偏相关性部分是提高识别接近接触的原因并不是因为它们去除了链状效应,而是因为过滤了起源于一般适应性约束的远程残基之间的相关性。相反,我们发现真正的链状效应是蛋白内部传播的实际物理扰动的表达,因此不能通过派生偏相关性来去除。
作者:Greg W. Clark, Sharon H. Ackerman, Elisabeth R. Tillier, Domenico L. Gatti
论文ID:1404.6684
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2014-04-29