双质学习:设计处理封闭集分布转变的算法框架
摘要:从具有弱监督和数据集变化的数据中训练机器学习模型仍然具有挑战性。针对这两种情况设计算法的研究尚未深入探索,现有算法不能始终处理最复杂的分布变化。我们认为双质量数据设置是设计这种算法的合适框架。双质量学习假设在训练时有两个数据集可用:一个样本来自感兴趣的分布的可信数据集,另一个是带有数据集变化和监督弱点的不可信数据集(也称为分布变化)。训练时可用的可信和不可信数据集使得设计能够处理任何分布变化的算法成为可能。我们提出了两种方法,一种受到标签噪声文献的启发,另一种受到协变量变化文献的启发,用于双质量学习。我们使用两种新方法在真实世界的许多数据集上合成引入了概念漂移和类条件变化。我们开展了一些讨论并评估了开发能够对分布变化鲁棒的双质量学习算法仍然是未来研究中的一个有趣问题。
作者:Pierre Nodet and Vincent Lemaire and Alexis Bondu and Antoine Cornu''ejols
论文ID:2308.15132
分类:Machine Learning
分类简称:cs.LG
提交时间:2023-08-30