$k$最近邻的两阶段主动学习算法

摘要:主动学习的$k$最近邻分类是一种受欢迎的非参数方法,因为它具有适应分布尺度变化的自动性。然而,迄今为止,设计保留这些可取特性的基于本地投票的分类器训练的主动学习策略一直很困难,因此在文献中明显缺少了$k$最近邻分类的主动学习策略。在这项工作中,我们引入了一种简单直观的主动学习算法用于训练$k$最近邻分类器,这是文献中首次保留了$k$最近邻投票概念的算法。我们对通过我们的方案获得的样本训练的改进的$k$最近邻分类器提供了一致性保证,并表明当条件概率函数$mathbb{P}(Y=y|X=x)$足够平滑且满足Tsybakov噪声条件时,我们主动训练的分类器以比被动训练的$k$最近邻分类器更快的渐近速率收敛于贝叶斯最优分类器。

作者:Nick Rittler and Kamalika Chaudhuri

论文ID:2211.10773

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-22

PDF 下载: 英文版 中文版pdf翻译中