使用GPU上的半精度粒子滤波器提升目标跟踪性能

摘要:GPU加速的高性能粒子滤波器方法对于物体检测应用至关重要,包括自动驾驶、机器人定位和时间序列预测。本文研究了在CUDA核心上使用半精度设计、开发和优化粒子滤波器,并将其性能和准确性与单精度和双精度基准在Nvidia V100、A100、A40和T4 GPU上进行比较。为了减轻数值不稳定性和精度损失,我们对粒子滤波器进行了算法变化。使用半精度相对于单精度和双精度基线分别提高了1.5-2倍和2.5-4.6倍的性能,代价是相对较小的准确性损失。

作者:Gabin Schieffer, Nattawat Pornthisan, Daniel Ara''ujo de Medeiros, Stefano Markidis, Jacob Wahlgren, Ivy Peng

论文ID:2308.00763

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-08-03

PDF 下载: 英文版 中文版pdf翻译中