通过图稀疏化近似持久性图之间的一阶Wasserstein距离

摘要:拓扑数据分析中,持久图(PD)起到核心作用。该分析需要计算这些图之间的距离,如1-Wasserstein距离。然而,使用现有方法计算大数据集和大图所产生的PD距离可能无法适应规模。困难的主要原因是需要计算匹配的二部图的大小。为了得到一个近似解,我们通过几个算法和计算观察来解决这个问题。首先,利用PD点的接近性,我们对其进行压缩,从而减少计算中图中的节点数量。增加的点的多样性通过将匹配问题转化为一个在转运网络上的最小成本流问题来解决。其次,我们使用Well Separated Pair Decomposition来将图稀疏化到与点的数量成线性关系的大小。节点和弧的稀疏化都对近似因子有贡献,我们利用Relaxed Word Mover's距离给出的下界。第三,我们通过并行化来消除稀疏化过程中的瓶颈。第四,我们开发了一个名为PDoptFlow的开源软件,基于我们的算法,利用GPU和多核进行并行计算。我们进行了大量实验,并且结果显示实际的经验误差非常低。我们还证明我们在低保证相对误差下可以实现高性能,从而改善现有技术的状态。

作者:Tamal K. Dey and Simon Zhang

论文ID:2110.14734

分类:Computational Geometry

分类简称:cs.CG

提交时间:2021-10-29

PDF 下载: 英文版 中文版pdf翻译中