通过几何集覆盖在轨迹数据中寻找复杂模式

摘要:轨迹聚类是处理大量移动数据的核心挑战,例如全身运动数据或GPS数据。我们研究了一个可以被描述为几何集合覆盖问题的聚类问题:给定一个复杂度为$n$的多边形曲线,找到复杂度最多为$l$的最小数量$k$的代表性轨迹,使得输入轨迹上的任意点都位于输入的子轨迹上,该子轨迹与其中一个代表性轨迹的Frechet距离最多为$\Delta$。Akitaya等人(2021年)和Brüning等人(2022年)首次研究了这个问题。他们提出了一个双标准近似算法,返回一个大小为$O(kl \log(kl))$的曲线集合,该集合可以在时间复杂度为$\widetilde{O}((kl)^2n + kln^3)$的情况下,以$11 \Delta$的半径覆盖输入数据,其中$k$是用于覆盖输入数据的复杂度为$l$的曲线的最小数量。他们的算法计算得到的代表性轨迹总是直线段。然而,在实际应用中,人们通常对由多个边组成的高复杂度的代表性曲线感兴趣。我们提出了一种新方法,基于Brüning等人(2022年)的工作,通过计算一个大小为$O(k \log(n))$的曲线集合,在$\widetilde{O}(l^2n^4 + kln^4)$的时间内保证与$11 \Delta$相同的距离,其中每个曲线可以由复杂度最多为给定复杂度参数$l$的曲线组成。为了验证我们的方法,我们对不同类型的真实世界数据进行了实验:高维全身运动数据和低维GPS跟踪数据。

作者:Jacobus Conradi and Anne Driemel

论文ID:2308.14865

分类:Computational Geometry

分类简称:cs.CG

提交时间:2023-08-30

PDF 下载: 英文版 中文版pdf翻译中