利用大规模数据集和图像增强提升水下视觉跟踪-arXiv论文预印本中文版

利用大规模数据集和图像增强提升水下视觉跟踪

摘要：一种新的数据集和通用的追踪增强方法用于水下视觉目标追踪（UVOT）。由于数据不可访问性，尽管其重要性，水下追踪一直未被探索。它面临着独特的挑战：水下环境展示了非均匀的光照条件，低能见度，缺乏清晰度，低对比度，伪装和悬浮颗粒的反射。针对这些条件，传统的主要针对陆地或露天场景设计的跟踪方法的性能下降。我们通过提出一种新颖的水下图像增强算法来解决这个问题，该算法专门用于提高追踪质量。该方法导致了最先进（SOTA）视觉追踪器的显著性能改进，最多可达5.0\%的AUC。为了开发稳健准确的UVOT方法，需要大规模数据集。为此，我们引入了一个大规模的UVOT基准数据集，包括400个视频段和275,000个手动注释帧，可用于水下深度追踪器的训练和评估。这些视频标有几个水下特定的追踪属性，包括水色变化、目标干扰物、伪装、目标相对大小和低能见度条件。UVOT400数据集、追踪结果和代码可在以下网址公开获取：https://github.com/BasitAlawode/UWVOT400。

作者：Basit Alawode, Fayaz Ali Dharejo, Mehnaz Ummar, Yuhang Guo, Arif Mahmood, Naoufel Werghi, Fahad Shahbaz Khan, Jiri Matas, Sajid Javed

论文ID：2308.15816

分类：Computer Vision and Pattern Recognition

分类简称：cs.CV

提交时间：2023-09-01

PDF 下载： 英文版中文版pdf翻译中