基于时间约束的粗糙集分割模型在挖掘序列模式中的应用
摘要:数据挖掘和知识发现方法现在被应用于各种企业和工程领域,以从数据库中发现有趣的模式。序列模式的研究是一个重要的数据挖掘问题,因为它广泛应用于现实世界的时间依赖数据库。序列模式是针对特定对象的以时间为基准的事件模式。在预定的时间段内分析和发现频繁的序列模式是有趣的数据挖掘结果,并且可以在许多企业应用中进行决策支持。序列模式挖掘问题存在计算挑战,因为长序列包含大量的频繁子序列。有效的结果也依赖于正确选择的事件窗口。在本文中,我们从两个角度研究了序列模式挖掘的问题,一个是问题的计算方面,另一个是时间约束的并入和可调性。我们使用了粗糙集理论中的不可区分关系来划分序列模式的搜索空间,并提出了一种新算法,允许模式的预可视化,并在执行挖掘任务之前调整时间约束。粗糙集分区算法比基于天然时间约束的序列模式挖掘算法GSP快至少十倍。此外,还使用该方法确定了序列模式的时间间隔的附加知识。
作者:Jigyasa Bisaria, Namita Shrivastava, K.R. Pardasani
论文ID:0906.4327
分类:Databases
分类简称:cs.DB
提交时间:2009-06-24