Web日志数据中的重要时间间隔和频繁模式发现

摘要:使用网络日志数据的序列挖掘研究有很多。我们使用了一种称为一趟频繁事件发现(FED)算法的方法,它与传统的Apriori类模式检测算法的方法不同。在这种方法中,首先为每个网站计算重要的时间间隔(独立计算),然后利用这些间隔来检测频繁模式/事件,并对重要的时间间隔和频繁模式进行分析,这可以用于根据以往趋势预测用户行为,也可以用于广告目的。这种应用程序可以预测网站的兴趣。在这种方法中,时间序列数据被折叠到一个周期性(日、周等)中,用于形成间隔。从满足用户指定的最小置信度和最大间隔长度标准的时间点中发现重要间隔。

作者:Kanak Saxena, Rahul Shukla

论文ID:1002.1185

分类:Databases

分类简称:cs.DB

提交时间:2010-02-08

PDF 下载: 英文版 中文版pdf翻译中