关于结合二进制预测方法在非折叠蛋白质性能上的研究
摘要:单一折叠预测器和组合评分的性能进行了关键评估。我们在743个折叠蛋白和81个自然未折叠蛋白的数据集上测试了平均包装,平均成对能量和新的gVSL2指数。这些预测器的个体性能与其他提出的方法相当,甚至更好。我们在这里引入了一个严格一致的分数S_SU,将它们结合在一起,但对于两个单一预测器分类不同的序列保持不确定。在通过S_SU评估方法未分类的蛋白质剔除的数据集上,单一预测器的性能显著提高,表明未分类的蛋白质主要是错误的预测。氨基酸组成是这些预测器考虑的主要因素,因此未分类的蛋白质的组成既与折叠状态相容,又与未折叠状态相容。这就是为什么从这些模糊蛋白质中对数据集进行剔除会提高单一预测器的性能。在三个领域中,通过S_SU被预测为自然未折叠的蛋白质的百分比分别为:细菌为4.1%,古生菌为1.0%,真核生物为20.0%。与以前的确定相符。提供了一种将自然未折叠蛋白质数量与基因组中蛋白质总数相关联的缩放定律的证据;关键指数的第一估计为1.95+- 0.21
作者:Antonio Deiana, Andrea Giansanti
论文ID:0806.4838
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2010-12-30