提升真实场景下的超范围检测：一种改进超范围检测泛化性能的新评估框架-arXiv论文预印本中文版

提升真实场景下的超范围检测：一种改进超范围检测泛化性能的新评估框架

摘要：一个新颖的评估框架用于评估机器学习模型在更真实的环境中的Out-of-Distribution（OOD）检测性能。我们观察到目前的测试协议不能满足测试OOD检测方法的实际需求，通常鼓励方法对正常数据的多样性水平具有很强的偏见。为了解决这个限制，我们提出了新的OOD测试数据集（CIFAR-10-R，CIFAR-100-R和ImageNet-30-R），可以让研究人员在真实的分布变化下评估OOD检测性能。此外，我们引入了一个广泛性评分（GS）来衡量模型在OOD检测过程中的泛化能力。我们的实验表明，改进现有基准数据集的性能并不一定能提高OOD检测模型在真实场景中的可用性。虽然利用深度预训练特征被认为是OOD检测研究的一个有希望的途径，但我们的实验表明，在我们提出的数据集上测试的最新预训练模型的性能明显下降。为了解决这个问题，我们提出了一个后处理阶段，在计算OOD分数之前，对这些分布变化下的预训练特征进行适应，从而显著提高了最先进的预训练模型在我们的基准测试上的性能。

作者：Vahid Reza Khazaie and Anthony Wong and Mohammad Sabokrou

论文ID：2211.10892

分类：Computer Vision and Pattern Recognition

分类简称：cs.CV

提交时间：2023-09-01

PDF 下载： 英文版中文版pdf翻译中