蛋白质的协方差核
摘要:使用信息理论和数据压缩的思想和技术,我们提出了一种适用于生物序列的新型核函数。这种核函数可以与任何核方法结合使用,特别是支持向量机用于蛋白质分类。通过将先验的生物学假设应用于氨基酸序列的属性,并使用贝叶斯平均框架,我们能够在线性时间和空间内计算出这个核函数的值,从前人在通用编码领域提出的成果中受益。在标准的蛋白质同源性检测实验中,我们得到了令人鼓舞的分类结果。
作者:Marco Cuturi, Jean-Philippe Vert
论文ID:q-bio/0310022
分类:Genomics
分类简称:q-bio.GN
提交时间:2011-01-05