遗传算法和哈希函数实现可扩展的原型选择
摘要:在非相似性空间中的分类已成为一个非常活跃的研究领域,因为它提供了一种从以成对非度量相似性形式给出的数据中进行学习的可能性,而这种方式在其他情况下可能很难处理。原型的选择是进一步创建该空间的关键步骤。然而,尽管以前已经努力寻找好的原型,但如何选择最佳的表示集仍然是一个未解决的问题。在本文中,我们提出了一种可扩展的方法,用于从非常大的数据集中选择原型集。该方法基于遗传算法、基于非相似性的哈希和两种不同的无监督和有监督的可扩展准则。无监督准则基于最小生成树,其中以原型为节点,非相似性为边。有监督准则基于计算对象和最近原型的匹配标签数。分析了使用这种类型算法在非相似性表示的特定情况中的适用性。实验结果表明,这些方法利用大型数据集选择出了好的原型,并且在低运行时间下这样做。
作者:Yenisel Plasencia-Cala~na, Mauricio Orozco-Alzate, Heydi M''endez-V''azquez, Edel Garc''ia-Reyes, Robert P.W. Duin
论文ID:1712.09277
分类:Machine Learning
分类简称:stat.ML
提交时间:2017-12-27