Refcat:互联网档案馆学术引用图
摘要:互联网档案馆(IA)作为其学术数据工作的一部分,发布了一个名为refcat的引用关系图数据集的第一个版本。该数据集由fatcat编目项目(IA Scholar的基础编目)收集的数据、针对主要和次要学术成果的相关网络爬行以及来自开放图书馆项目和维基百科的元数据组成。这个图的第一个版本包含了超过13亿条引用。我们将该数据集在Internet Archive上以CC0公有领域捐赠的形式发布。用于派生过程的源代码,包括精确和模糊引文匹配,以MIT许可证的形式发布。本报告的目的是简要描述当前数据集的内容和派生过程。
作者:Martin Czygan, Helge Holzmann and Bryan Newbold
论文ID:2110.06595
分类:Digital Libraries
分类简称:cs.DL
提交时间:2021-10-15