时间弯曲编辑距离与刚度调整在时间序列匹配中的应用

摘要:基于时间序列到时间序列纠正问题,我们类似于字符串到字符串纠正问题的方式来解决时间序列相似性问题,其中两个时间序列之间的相似性被定义为将一个时间序列转化为另一个时间序列所需的最小成本序列“编辑操作”。为了定义“编辑操作”,我们使用了图形编辑过程的范例,并最终得到了一个被我们称为时间弯曲编辑距离(TWED)的动态规划算法。TWED在形式上与动态时间扭曲、最长公共子序列或带有实际惩罚的编辑距离算法略有不同。特别地,它强调了一个参数,该参数在时间轴上驱动了弹性度量的一种刚度。我们表明,TWED提供的相似性是一种潜在有效的度量方法,可用于时间序列检索应用,因为它可以利用三角不等式属性加快检索过程,同时调整弹性度量的参数。在这个背景下,我们推导出一个下采样表示空间中时间序列匹配与原空间匹配之间的下界。我们在一个简单的分类任务上评估了TWED距离的经验质量。与编辑距离、动态时间扭曲、最长公共子序列和带有实际惩罚的编辑距离相比,TWED在所考虑的实验任务上被证明是相当有效的。

作者:Pierre-Franc{c}ois Marteau (VALORIA)

论文ID:cs/0703033

分类:Information Retrieval

分类简称:cs.IR

提交时间:2008-12-28

PDF 下载: 英文版 中文版pdf翻译中