时间序列分类的自动特征工程:评估与讨论

摘要:时间序列分类 (TSC) 在过去的二十年中受到了广泛关注,仍然是数据科学和知识工程中的一个关键而具有挑战性的问题。实际上,随着时间序列数据的日益可得性,研究界在文献中提出了许多 TSC 算法。除了基于相似度度量、区间、片段、词典、深度学习方法或混合集成方法的最新方法之外,最近几年还设计了一些从时间序列中提取无监督信息汇总统计(即特征)的工具。最初为描述性分析和可视化具有信息丰富且可解释性特征的时间序列而设计的这些特征工程工具中,很少有被用于 TSC 问题的基准测试,并且很少与最先进的 TSC 算法在预测性能方面进行比较。在本文中,我们旨在填补这个空白,并提出了一个简单的 TSC 过程,以评估使用现有特征工程工具获得的特征集的潜在预测性能。因此,我们对112组时间序列数据集进行了11个特征工程工具与9个监督分类器分支的经验性研究。对于10000多个学习实验的结果进行的分析表明,基于特征的方法与当前最先进的 TSC 算法一样准确,因此应该在 TSC 文献中进一步考虑。

作者:Aur''elien Renault and Alexis Bondu and Vincent Lemaire and Dominique Gay

论文ID:2308.01071

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-14

PDF 下载: 英文版 中文版pdf翻译中