使用全局影响力度量的社区检测

摘要:在线社交网络的日益流行为研究人员提供了大量的社交网络数据。这一点,加上计算速度的不断增加、存储容量的增加和数据挖掘能力的增强,引发了对自动社区检测方法的新兴兴趣。令人惊讶的是,没有普遍公认的社区定义。一种经常使用的定义是:“与把集合与世界其他部分连接的‘切割边’相比,有更多和/或更好连接的‘内部边’公司”[Leskovec等人,2008]。这个定义激发了最大模块性类的社区检测算法,这些算法寻找网络中具有预期以上边密度的区域。我们提出了一种替代定义,即社区由对社区内部的其他人具有更多影响力的个体组成。我们提出了影响力的数学形式化,定义了基于影响力的模块度指标,并展示了如何使用它来将网络分成社区。我们在文献中使用的标准数据集上评估了我们的方法,并发现它通常优于基于边的模块度算法。

作者:Rumi Ghosh and Kristina Lerman

论文ID:0805.4606

分类:Computers and Society

分类简称:cs.CY

提交时间:2008-12-18

PDF 下载: 英文版 中文版pdf翻译中