网络使用数据预处理方法调查
摘要:全球网络是一个庞大的网页和链接储备库。它为互联网用户提供了丰富的信息。网络的增长是巨大的,每天大约有一百万个网页被添加。用户的访问记录在网络日志中。由于网络的巨大使用量,网络日志文件增长速度很快,大小变得巨大。网络数据挖掘是将数据挖掘技术应用于网络数据的过程。网络使用挖掘将挖掘技术应用于日志数据中,以提取用户行为,用于各种应用,如个性化服务、适应性网站、客户配置文件、预取、创建吸引人的网站等。网络使用挖掘包括三个阶段:预处理、模式发现和模式分析。网络日志数据通常是嘈杂和模棱两可的,在挖掘之前进行预处理是一个重要的过程。为了发现模式,需要高效地构建会话。本文回顾了预处理阶段的现有工作。简要介绍了各种用于发现模式和模式分析的数据挖掘技术。最后,还简要介绍了网络使用挖掘的各种应用。
作者:V.Chitraa, Dr. Antony Selvdoss Davamani
论文ID:1004.1257
分类:Information Retrieval
分类简称:cs.IR
提交时间:2010-04-09