评估深度神经网络预测的可信度得分
摘要:为了使开发人员和监管机构对采用深度神经网络(DNN)的自主系统的部署更加有信心,DNN在运行过程中的连续验证是具有挑战性的,因为缺乏人工监视。在操作过程中,了解DNN的预测何时是可靠的或可疑的对安全至关重要。在缺乏人工监视的情况下,基本的方法是使用模型的输出置信度分数来评估预测的可靠性或可疑性。然而,模型的置信度分数是来自黑盒子计算的结果,因此缺乏透明度,使得自动地为预测信任度赋分变得具有挑战性。我们引入可信度分数(TS),这是一个简单的度量标准,与模型的置信度分数相比,提供了一种更透明和有效的方式来对DNN的预测进行信任度评估。该度量标准通过检查DNN所做预测中是否存在特定特征来量化预测的可信度。我们还使用TS度量标准的基本思想,在整个输入帧中提供一个可疑度分数(SS),以帮助检测存在错误否定的可疑帧。我们使用YOLOv5对人体检测进行案例研究,以展示我们的方法和TS和SS的使用。案例研究表明,与仅依赖模型置信度分数相比,使用我们的方法可以始终提高预测的精度,包括1)批准可信度预测(提高约20%)和2)检测可疑帧(提高约5%)。
作者:Abanoub Ghobrial, Darryl Hond, Hamid Asgari, Kerstin Eder
论文ID:2301.08839
分类:Machine Learning
分类简称:cs.LG
提交时间:2023-08-31