蛋白质的协方差核

摘要:使用信息理论和数据压缩的思想和技术,我们提出了一种适用于生物序列的新型核函数。这种核函数可以与任何核方法结合使用,特别是支持向量机用于蛋白质分类。通过将先验的生物学假设应用于氨基酸序列的属性,并使用贝叶斯平均框架,我们能够在线性时间和空间内计算出这个核函数的值,从前人在通用编码领域提出的成果中受益。在标准的蛋白质同源性检测实验中,我们得到了令人鼓舞的分类结果。

作者:Marco Cuturi, Jean-Philippe Vert

论文ID:q-bio/0310022

分类:Genomics

分类简称:q-bio.GN

提交时间:2011-01-05

PDF 下载: 英文版 中文版pdf翻译中