基于功能分类的蛋白质序列的概率标注

摘要:将未经化学处理的蛋白质序列与已知功能的蛋白质进行比对,根据相似性来判断待测序列的功能,这是生物信息学领域最重要的成果之一。本文提出了一种与传统方法相反的新思路,即将待测序列直接映射到功能分类中,而不是将功能映射到序列聚类中。该方法使用序列相似性来确定待测序列属于哪种功能类别。作者提出了一种基于相关指标的测量方法来衡量序列与功能之间的关系,并提出了两种贝叶斯方法来估计未知功能序列属于某个功能类别的概率。与简单的将注释从最高评分的BLAST匹配中转移的策略相比,该方法的性能明显更高,预计在自动化功能注释流程中会有广泛应用。

作者:Emmanuel D. Levy (LMB), Christos A. Ouzounis, Walter R. Gilks, Benjamin Audit (Phys-ENS)

论文ID:0709.4425

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2007-09-28

PDF 下载: 英文版 中文版pdf翻译中