通过依赖多层信息的相似性网络融合进行期刊文章的细粒度分类:以《剑桥经济学杂志》为例
摘要:基于多种信息来源,而不是仅依赖一个信息来源,本文探讨了通过相似性网络融合(SNF)技术对期刊文章进行分类的可能性。具体而言,当文章以多层复合网络的形式组织时,该方法利用SNF技术将文章的不同信息层合并起来。所提出的方法在一个案例研究中进行了测试,该案例研究包括了发表在《剑桥经济学期刊》上的文章。文章信息以一种双层复合方式进行组织,其中第一层包含了基于全文的文章相似性,第二层包含了基于引用参考文献的相似性。无监督的相似性网络融合过程通过构建一个新的单层网络来结合这两个层。然后使用距离相关和偏差距离相关指标来估计每个信息层对融合网络结构的贡献。最后,将聚类算法应用于融合网络,以获取文章的分类。通过专家的视角对SNF所得到的分类进行了评估,检查其是否可以与经济学中采用的研究计划和方法学进行解释和标记。此外,将融合网络中获得的分类与仅考虑引用参考文献和内容时所得到的两个分类进行了比较。总体而言,融合网络上获得的分类似乎足够细致,可以代表《剑桥经济学期刊》中所发表的贡献的极端异质性。
作者:Alberto Baccini and Lucio Barabesi and Martina Cioni and Eugenio Petrovich and Daria Pignalosa
论文ID:2305.00026
分类:Digital Libraries
分类简称:cs.DL
提交时间:2023-05-02