深度学习模型在面部识别中的优势与弱点对抗图像退化
摘要:面对诸多计算机视觉任务,包括人脸识别,基于深度卷积神经网络(CNN)的方法目前是最先进的技术。当前对进一步改进深度CNN的研究主要集中在更强大的模型架构和更好的学习技术上。然而,在现有深度模型在人脸识别方面的优势和劣势方面的系统研究还相对较少。本文旨在填补这一空白,并通过使用Labeled Faces in the Wild(LFW)数据集研究不同协变量对四种最近的深度CNN模型的验证性能的影响。具体而言,我们调查了与图像质量(模糊、JPEG压缩、遮挡、噪声、图像亮度、对比度、缺失像素)和模型特性(CNN架构、彩色信息、描述符计算)有关的协变量,并分析了它们对AlexNet、VGG-Face、GoogLeNet和SqueezeNet的人脸验证性能的影响。基于全面而严格的实验,我们确定了深度学习模型的优势和劣势,并提出了潜在未来研究的关键领域。我们的结果表明,高水平的噪声、模糊、缺失像素和亮度对所有模型的验证性能都具有有害影响,而对比度变化和压缩伪影的影响有限。研究发现,描述符计算策略和彩色信息对性能没有显著影响。
作者:Klemen Grm, Vitomir v{S}truc, Anais Artiges, Matthieu Caron, Hazim Kemal Ekenel
论文ID:1710.01494
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-04-11