使用基于层次的贝叶斯模型进行基因功能分类
摘要:基于蛋白质序列的几个特征(包括系统发生描述符、基于序列的属性和预测的二级结构),我们研究了分层分类方案在基因功能注释中的应用。我们讨论了三个贝叶斯模型,并比较了它们在预测准确度方面的性能。这些模型是普通的多项式逻辑(MNL)模型,基于一组嵌套的MNL模型的分层模型,以及具有引入层次结构中相邻类别参数相关性先验的MNL模型。我们还提供了一种结合不同信息来源的新方法。我们使用这些模型来预测大肠杆菌基因组中的开放阅读框架(ORFs)的功能类别。所有三个模型的结果都比以前基于C5算法的方法有了很大的改进。基于层次结构的MNL模型的先验超越了非分层MNL模型和嵌套MNL模型。与以前尝试的结合这些信息来源的方法相比,我们的方法在与单独使用每个数据源的模型相比时具有更高的准确率。综上所述,这些结果表明,使用合适的先验信息,可以比以前更准确地预测基因功能的贝叶斯模型。
作者:Babak Shahbaba and Radford M. Neal
论文ID:q-bio/0605015
分类:Genomics
分类简称:q-bio.GN
提交时间:2007-05-23