大规模时间序列中高效的广义时间模式挖掘利用互信息
摘要:从越来越广泛的IoT传感器部署在不同环境中收集的大时间序列中,可以挖掘出重要的见解。通过从这些时间序列中挖掘时间模式,可以获得重要的见解。时间模式挖掘(TPM)通过将事件时间间隔添加到提取的模式中,使其更有表现力,但时间和空间复杂性也增加。除了频繁时间模式(FTPs)外,还有一种有用的时间模式,称为罕见时间模式(RTPs),它们很少出现但置信度很高。挖掘罕见时间模式会带来额外的挑战。对于FTP挖掘,时间信息和事件之间的复杂关系已经创建了一个指数级的搜索空间。对于RTP挖掘,支持度设置得很低,进一步造成组合爆炸,并可能产生太多无趣的模式。因此,需要一种通用的方法,既能挖掘频繁时间模式又能挖掘罕见时间模式。本文提出了我们的时间序列广义时间模式挖掘(GTPMfTS)方法,具有以下具体贡献:(1)以时间序列为输入,产生频繁/罕见时间模式为输出的端到端GTPMfTS过程。(2)高效的广义时间模式挖掘(GTPM)算法,在挖掘过程中使用高效的数据结构快速检索事件和模式,并采用有效的修剪技术来加快挖掘速度。(3)GTPM的近似版本使用了数据相关性度量互信息来修剪掉不太有前途的时间序列。
作者:Van Long Ho, Nguyen Ho, Torben Bach Pedersen, and Panagiotis Papapetrou
论文ID:2306.10994
分类:Databases
分类简称:cs.DB
提交时间:2023-06-21