回归基础:对现代时间序列分类算法的合理性检验

摘要:时间序列分类的最新发展已经取得了长足的进步,从1NN-DTW算法到ROCKET系列分类器。然而,在当前新分类器飞速发展的过程中,退一步进行简单的基准测试是至关重要的。这些测试经常被忽视,因为研究人员专注于建立新的最先进结果、开发可扩展的算法和让模型能够解释。然而,有很多数据集乍一看像是时间序列,但是在这些问题上,经典的无时间顺序的表格方法可能表现更好。例如,在光谱数据集上,表格方法往往比最近的时间序列方法表现优秀。在本研究中,我们比较了使用经典机器学习方法(如岭回归、线性判别分析、随机森林)的表格模型与ROCKET系列分类器(如Rocket、MiniRocket、MultiRocket)的性能。表格模型简单且非常高效,而ROCKET系列分类器更复杂,并且在最近的时间序列分类器中具有最先进的准确性和效率。我们发现,在UCR/UEA基准测试中,表格模型在大约19\%的单变量数据集和28\%的多变量数据集上优于ROCKET系列分类器,并且在大约50\%的数据集上准确度在10个百分点内。我们的结果表明,在开发时间序列分类器时,考虑简单的表格模型作为基准是很重要的。这些模型非常快速,可能与更复杂的方法一样有效,并且可能更容易理解和部署。

作者:Bhaskar Dhariyal, Thach Le Nguyen, Georgiana Ifrim

论文ID:2308.07886

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-16

PDF 下载: 英文版 中文版pdf翻译中