对一个世纪的引用分布建模-arXiv论文预印本中文版

对一个世纪的引用分布建模

摘要：100年来引用分布的变化可以揭示科学社区或学科的演变情况。关于未被引用的论文或高度引用的论文，在大部分出版物中的普遍性，提供了关于科学研究动态的重要线索。本文利用自1900年至2006年期间从Web of Science中获得的2500万篇论文和6亿条引用，提出了一个基于随机选择过程的简单模型来解释最近几年中“被忽视”现象及其下降。我们展示了未被引用论文的比例是1）在特定年份发表的文章数量（竞争性论文）和2）随后发表的文章数量（引用论文）以及它们所包含的引用数量的函数。利用未被引用作为出发点，我们证明了拉伸指数函数和一种形式的Tsallis函数在整个20世纪的引用分布拟合中的实用性。与简单的幂律拟合相反，这两种方法都被证明是经验上有根据并且足够稳健以更好地理解整体引用动态。基于这些模型的扩展，对于我们对未被引用情况的新理解以及我们的大型数据集，我们能够提供明确的定量证据和暂时的解释，以说明20世纪60年代发生的一个重要的引文实践转变。我们还提议对“引用经典”类别进行修订，将其作为与该领域其他论文明显区分的一组文章。

作者：Matthew L. Wallace, Vincent Larivi`ere, Yves Gingras

论文ID：0810.1426

分类：Physics and Society

分类简称：physics.soc-ph

提交时间：2008-10-09

PDF 下载： 英文版中文版pdf翻译中