集合覆盖分类:原型向量机

摘要:新型最近原型分类器介绍:原型向量机(PVM)。它源于一个组合优化问题,被转化为一个集合覆盖问题的变体。我们提出了两种用于近似解决问题的算法。PVM选择了一小部分代表性点,并用于分类。它包含1-NN作为一种特殊情况。该方法与任何不相似度度量相容,适用于数据不嵌入底层特征空间的情况,或者使用非欧几里得度量是希望的情况。事实上,我们通过对广泛研究的邮政编码数据的示例演示了PVM如何利用特定问题的度量获益。在这个例子中,PVM优于高度成功的1-NN + 切线距离(tangent distance),并且仅保留少于一半的数据点。这个例子突出了PVM在产生低误差、高度可解释的模型方面的优势。此外,我们将PVM应用于蛋白质分类问题中,其中使用了基于核的距离。

作者:Jacob Bien, Robert Tibshirani

论文ID:0908.2284

分类:Machine Learning

分类简称:stat.ML

提交时间:2009-08-18

PDF 下载: 英文版 中文版pdf翻译中