利用大规模数据集和图像增强提升水下视觉跟踪
摘要:一种新的数据集和通用的追踪增强方法用于水下视觉目标追踪(UVOT)。由于数据不可访问性,尽管其重要性,水下追踪一直未被探索。它面临着独特的挑战:水下环境展示了非均匀的光照条件,低能见度,缺乏清晰度,低对比度,伪装和悬浮颗粒的反射。针对这些条件,传统的主要针对陆地或露天场景设计的跟踪方法的性能下降。我们通过提出一种新颖的水下图像增强算法来解决这个问题,该算法专门用于提高追踪质量。该方法导致了最先进(SOTA)视觉追踪器的显著性能改进,最多可达5.0\%的AUC。为了开发稳健准确的UVOT方法,需要大规模数据集。为此,我们引入了一个大规模的UVOT基准数据集,包括400个视频段和275,000个手动注释帧,可用于水下深度追踪器的训练和评估。这些视频标有几个水下特定的追踪属性,包括水色变化、目标干扰物、伪装、目标相对大小和低能见度条件。UVOT400数据集、追踪结果和代码可在以下网址公开获取:https://github.com/BasitAlawode/UWVOT400。
作者:Basit Alawode, Fayaz Ali Dharejo, Mehnaz Ummar, Yuhang Guo, Arif Mahmood, Naoufel Werghi, Fahad Shahbaz Khan, Jiri Matas, Sajid Javed
论文ID:2308.15816
分类:Computer Vision and Pattern Recognition
分类简称:cs.CV
提交时间:2023-09-01