通过二阶统计量评估和测量网络中同质性的新方法

摘要:在具有分类属性的网络中,我们提出了一种评估和测量同质性的新方法。这种方法适用于网络的节点被分成类(颜色)的情况。我们在两个不同类别的网络中验证了这种方法:i)蛋白质相互作用(PPI)网络,其中节点对应于蛋白质,根据功能角色进行划分,边表示蛋白质之间的功能相互作用;ii)Pokec在线社交网络,其中节点对应于用户,根据年龄进行划分,边表示用户之间的友谊关系。和其他经典和固定的方法类似,我们的方法通过将每个类别引发的子图的相对边密度与相应的零模型下的预期相对边密度进行比较来衡量同质性。我们方法的新颖之处在于规定了一个内生的零模型,即零模型的样本空间是由输入网络自身构建的。这使得我们能够给出每个类别的相对边密度的z-score的确切显式表达式以及其他相关统计量。z-score直接通过切比雪夫不等式量化了观察到的同质性的统计显著性。每个z-score的表达式通过网络结构来计算,如具有两个跨度边的子图数。对于具有n个节点和m条边的网络,每个z-score的计算时间为O(n + m),从而导致了一种整体高效的同质性评估方法。我们通过考虑每个类别引发的子图中孤立节点的z-score来补充同质性/异质性的分析,计算时间为O(nm)。然后利用理论结果显示,预计所分析的两个网络类别在考虑的节点属性方面都显著同质。

作者:Nicola Apollonio, Paolo Giulio Franciosa, Daniele Santoni

论文ID:2107.10037

分类:Discrete Mathematics

分类简称:cs.DM

提交时间:2022-05-09

PDF 下载: 英文版 中文版pdf翻译中