基于PARAFAC张量分解的节点-上下文网络聚类
摘要:使用PARAFAC张量分解的方法,描述了一种用于聚类标记链接网络(语义图)的方法,该方法可以将重要节点(高度连接的节点)与其相关链接的标签进行分组。在这种类型的网络中,邻接矩阵无法完全描述网络结构的所有信息。我们必须将矩阵扩展为三维邻接张量,以便不仅包括节点连接到哪些节点的信息,还包括连接节点的标签信息。通过对该张量应用PARAFAC分解,我们可以得到两个列表,节点和链接标签,每个分解组都附有得分。因此,通过按降序排序列表,可以简单地进行聚类过程,以获取重要节点及其相关标签。为了测试该方法,我们使用博客数据集构建了带有标记链接的网络,其中博客是节点,标记链接是它们之间的共享单词。结果与标准度量之间的相似性度量看起来很有希望,特别是对于两个最重要的任务,即找到与博客查询最相关的词和找到与博客查询最相似的博客,相似度约为0.87。
作者:Andri Mirzal and Masashi Furukawa
论文ID:1005.0268
分类:Information Retrieval
分类简称:cs.IR
提交时间:2010-05-04