电子商务领域中跨站点预处理和聚类方法的益处

摘要:ECMLPKDD 2005发现挑战中,我们对点击流数据集进行了预处理和聚类分析。本文的主要贡献有两个。首先,我们展示了点击流数据集,并展示了如何基于先进的预处理构建一个丰富的数据仓库。我们考虑了给定电子商务领域中 intersite 方面,这提供了一个有趣的数据结构化。给出了基于时间段点击流的初步统计分析,强调了 intersite 用户访问在这种情况下的重要性。其次,我们描述了我们的交叉聚类方法,该方法应用于从我们的数据仓库生成的数据上。我们的初步结果是有趣和有希望的,说明了我们的 WUM 方法的好处,尽管在相同的数据集上需要更多的研究。

作者:Sergiu Theodor Chelcea (INRIA Rocquencourt / INRIA Sophia Antipolis), Alzennyr Da Silva (INRIA Rocquencourt / INRIA Sophia Antipolis), Yves Lechevallier (INRIA Rocquencourt / INRIA Sophia Antipolis), Doru Tanasa (INRIA Rocquencourt / INRIA Sophia Antipolis), Brigitte Trousse (INRIA Rocquencourt / INRIA Sophia Antipolis)

论文ID:cs/0511106

分类:Databases

分类简称:cs.DB

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中