可靠半监督学习的对比可信度传播
摘要:半监督学习(SSL)存在产生标签的错误,这使得SSL变得困难。我们往往很少了解算法何时以及为什么无法超越监督基线。我们使用基准数据集构建了五种常见的现实世界SSL数据场景:少数标签、开放集、噪声标签、标记和未标记集中的类分布不平衡/不对齐。我们提出了一种名为Contrastive Credibility Propagation (CCP)的新算法,通过迭代的迁移伪标签改进实现了深度SSL。CCP将半监督学习和噪声标签学习统一起来,以可靠地在任何数据场景中超越监督基线。与先前专注于一部分场景的方法相比,CCP在所有场景中独特地超越了监督基线,为从业人员在不了解有标签或无标签数据质量时提供了支持。
作者:Brody Kutt, Pralay Ramteke, Xavier Mignot, Pamela Toman, Nandini Ramanan, Sujit Rokka Chhetri, Shan Huang, Min Du, William Hewlett
论文ID:2211.09929
分类:Machine Learning
分类简称:cs.LG
提交时间:2023-08-31