空间数据库中的带障碍聚类

摘要:在存在障碍物的情况下进行聚类的问题是对大型空间数据库进行聚类的一个重要问题,它试图找到空间区域中的密集人口区域,以便在数据挖掘、知识发现或高效信息检索中使用。然而,大多数算法忽视了现实世界中存在的河流、湖泊和高速公路等物理障碍物,并可能影响聚类的结果。在本文中,我们提出了一种名为CPO的高效聚类技术来解决在存在障碍物的情况下进行聚类的问题。该算法将空间区域划分为矩形单元格。每个单元格与用于将其标记为密集或非密集的统计信息相关联。它还将每个单元格标记为受阻(即与任何障碍物相交)或非受阻。对于每个受阻的单元格,算法会找到一定数量的非受阻的子单元格。然后,它通过广度优先搜索找到非受阻的单元格或子单元格的密集区域作为所需的聚类,并为每个区域确定一个中心。

作者:Mohamed A. El-Zawawy, Mohamed E. El-Sharkawi

论文ID:0909.4409

分类:Databases

分类简称:cs.DB

提交时间:2009-09-25

PDF 下载: 英文版 中文版pdf翻译中