顶级域名和内容语言的网络归档覆盖率剖析
摘要:通过只向可能拥有归档页面的网页存档发送查询,我们研究了对集成式 Memento 时间地图(归档网页的时间和位置列表)的影响。我们使用来自多种来源的数据(网页、归档存取日志和向归档发送的全文查询)对十二个公共网页存档进行了分析,并发现对于任何请求,只向前三个网页存档发送查询(即查询数量减少 75%)可以在 84% 的情况下生成完整的时间地图。
作者:Ahmed AlSum, Michele C. Weigle, Michael L. Nelson, Herbert Van de Sompel
论文ID:1309.4008
分类:Digital Libraries
分类简称:cs.DL
提交时间:2013-09-17