散射网络:分析网络上信息散布的新方法
摘要:网络上的任何给定主题的信息通常都是零散的。以前,通过在网页上分布一系列事实(即信息片段)来描述这种散乱情况,显示出通常只有一些页面包含该主题的许多事实,而许多页面只包含一些事实。虽然这些方法揭示了重要的散射现象,但它们是有损的,因为它们掩盖了特定事实(例如罕见事实)在特定类型的页面(例如富有事实的页面)中出现的方式。为了揭示这种规律,我们构建了二部图网络,由两种类型的顶点组成:网页中包含的事实和网页本身。这样的表示能够应用一系列网络分析技术,揭示连接性、鲁棒性和聚类等结构特征。我们讨论了每个特征对用户在网上寻找综合信息能力的影响。最后,我们将网页和事实的二部图结构与网页之间的超链接结构进行了比较。
作者:Lada A. Adamic, Suresh K. Bhavnani and Xiaolin Shi
论文ID:cs/0611131
分类:Information Retrieval
分类简称:cs.IR
提交时间:2007-06-13