分析使用Memento引用的Web资源的持久性
摘要:来自学术资源库的论文所引用的网络资源的持久性和可用性的研究结果称,该研究调查了具有不同特征的两个资源库,即arXiv和UNT数字图书馆,以确定资源库的性质或其内容是否对被引用的网络资源的可用性有影响。利用Memento可以自动发现存档资源,并考虑研究发布与引用URL存档之间的时间。这种自动化处理了超过160,000个URL,是已知的最大规模的研究,并且通过资源库的元数据可以按学科考虑结果。结果令人震惊:从arXiv引用的URL中有45%(66,096个)仍然存在,但未被保存给未来世代,并且UNT论文所引用的资源中有28%已经丢失。未来,我们提供了一些建议,包括资源库应该发布从论文中提取的URL列表,以用作网络存档系统的种子。
作者:Robert Sanderson, Mark Phillips, Herbert Van de Sompel
论文ID:1105.3459
分类:Digital Libraries
分类简称:cs.DL
提交时间:2011-05-18