柔性蛋白质互作对接算法的不确定性定量化

摘要:算法的强弱最终由其结果的置信度决定。当问题的领域很大时(例如遍历高维空间),无法得到完美的解决方案,因此必须进行近似。这些近似通常导致关注量(QOI)在运行之间变化,降低了单次运行的置信度。当算法基于不确定或嘈杂的数据进一步计算这个最终QOI时,最终QOI的变异性(或置信度不足)增加。在这两个不确定性来源没有限制的情况下(算法近似和输入数据的不确定性),可能导致报告的统计量与实际情况的相关性低。 在生物应用中,这尤其适用,因为搜索空间通常以某种程度进行近似(例如高比例的蛋白质结构无效或能量不利),将连续空间转换为离散空间的显式转换意味着输入数据存在一定的不确定性。本研究将不确定性量化技术应用于困难的蛋白质-蛋白质对接问题,首先展示现有软件中存在的变异性,然后提供一种计算概率证书(以Chernoff-like界限的形式)的方法。最后,本文利用这些概率证书准确界定了来自两个对接算法的对接不确定性,提供了既具有鲁棒性又具有统计意义的QOI。

作者:Nathan Clement

论文ID:1906.10253

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2019-06-26

PDF 下载: 英文版 中文版pdf翻译中