可靠半监督学习的对比可信度传播-arXiv论文预印本中文版

可靠半监督学习的对比可信度传播

摘要：半监督学习（SSL）存在产生标签的错误，这使得SSL变得困难。我们往往很少了解算法何时以及为什么无法超越监督基线。我们使用基准数据集构建了五种常见的现实世界SSL数据场景：少数标签、开放集、噪声标签、标记和未标记集中的类分布不平衡/不对齐。我们提出了一种名为Contrastive Credibility Propagation (CCP)的新算法，通过迭代的迁移伪标签改进实现了深度SSL。CCP将半监督学习和噪声标签学习统一起来，以可靠地在任何数据场景中超越监督基线。与先前专注于一部分场景的方法相比，CCP在所有场景中独特地超越了监督基线，为从业人员在不了解有标签或无标签数据质量时提供了支持。

作者：Brody Kutt, Pralay Ramteke, Xavier Mignot, Pamela Toman, Nandini Ramanan, Sujit Rokka Chhetri, Shan Huang, Min Du, William Hewlett

论文ID：2211.09929

分类：Machine Learning

分类简称：cs.LG

提交时间：2023-08-31

PDF 下载： 英文版中文版pdf翻译中