统计学家的共引网络和共同作者网络

摘要:对统计学领域的出版物进行了大规模的数据收集和清理。数据集包括83,331篇发表在36本代表性统计学、概率论和机器学习期刊上的论文的合作者关系和引用关系,跨越了41年的时间。该数据集允许我们构建许多不同的网络,并激发了有关统计学界研究模式和趋势、研究影响力和网络拓扑的许多研究问题。在本文中,我们重点研究了(i)利用引用关系估计作者的研究兴趣,以及(ii)利用合作者关系研究网络拓扑结构。 利用我们构建的共引网络,我们发现了一个类似于统计哲学三角的“统计三角”。我们提出了构建统计学家的“研究地图”和可视化给定作者的“研究轨迹”等新方法来。利用我们构建的合作作者网络,我们发现了一个多层次的社区树,并制作了一个桑基图来可视化不同子领域中的作者迁移。我们还提出了几个衡量个人作者的研究多样性的新指标。 我们发现,“贝叶斯”、“生物统计学”和“非参数统计”是统计学领域的三个主要研究方向。我们还确定了15个子领域,每个子领域都可以看作主要领域的加权平均,并找出了合作者社区形成的一些潜在原因。我们还发现,在我们研究的41年时间窗口内,统计学家的研究兴趣发生了显著变化:一些领域(如生物统计学、高维数据分析等)变得越来越受欢迎。

作者:Pengsheng Ji, Jiashun Jin, Zheng Tracy Ke, Wanshan Li

论文ID:2204.11194

分类:Digital Libraries

分类简称:cs.DL

提交时间:2022-04-26

PDF 下载: 英文版 中文版pdf翻译中