Zoom-SVD: 在任意时间范围内快速和高效提取关键模式的方法

摘要:在给定多个时间序列数据的情况下,我们如何高效地在任意时间范围内找到潜在模式?奇异值分解(SVD)是发现多个时间序列数据中隐藏因素的重要工具,并已在许多数据挖掘应用中使用,包括降维、主成分分析、推荐系统等。除了静态版本之外,增量SVD还被用于处理多个半无限时间序列数据并识别数据的模式。然而,现有的多个时间序列数据分析的SVD方法在任意时间范围内并不提供数据模式检测的功能:标准SVD需要为与时间范围查询相对应的所有时间间隔提供数据,而增量SVD不考虑任意时间范围。在本文中,我们提出了Zoom-SVD,一种快速且内存高效的方法,用于在任意时间范围内找到时间序列数据的潜在因素。Zoom-SVD逐块递增地压缩多个时间序列数据以减少存储阶段的空间成本,并通过精心拼接存储的SVD结果,在查询阶段高效计算给定时间范围查询的奇异值分解(SVD)。通过大量实验证明,Zoom-SVD比现有方法快15倍,占用的空间少15倍。我们的案例研究表明,Zoom-SVD对于捕捉与查询时间范围相似的过去时间范围的模式非常有用。

作者:Jun-Gi Jang, Dongjin Choi, Jinhong Jung, U Kang

论文ID:1805.00754

分类:Numerical Analysis

分类简称:cs.NA

提交时间:2018-12-21

PDF 下载: 英文版 中文版pdf翻译中