提升真实场景下的超范围检测:一种改进超范围检测泛化性能的新评估框架
摘要:一个新颖的评估框架用于评估机器学习模型在更真实的环境中的Out-of-Distribution(OOD)检测性能。我们观察到目前的测试协议不能满足测试OOD检测方法的实际需求,通常鼓励方法对正常数据的多样性水平具有很强的偏见。为了解决这个限制,我们提出了新的OOD测试数据集(CIFAR-10-R,CIFAR-100-R和ImageNet-30-R),可以让研究人员在真实的分布变化下评估OOD检测性能。此外,我们引入了一个广泛性评分(GS)来衡量模型在OOD检测过程中的泛化能力。我们的实验表明,改进现有基准数据集的性能并不一定能提高OOD检测模型在真实场景中的可用性。虽然利用深度预训练特征被认为是OOD检测研究的一个有希望的途径,但我们的实验表明,在我们提出的数据集上测试的最新预训练模型的性能明显下降。为了解决这个问题,我们提出了一个后处理阶段,在计算OOD分数之前,对这些分布变化下的预训练特征进行适应,从而显著提高了最先进的预训练模型在我们的基准测试上的性能。
作者:Vahid Reza Khazaie and Anthony Wong and Mohammad Sabokrou
论文ID:2211.10892
分类:Computer Vision and Pattern Recognition
分类简称:cs.CV
提交时间:2023-09-01