机器人在网络档案中仍然超过人类,但比以前少了
摘要:比较2012年和2019年间Internet Archive的机器人和人类的用户访问模式,通过分析访问日志识别用户会话并根据浏览行为将其分类为机器人或人类。通过评估这些会话来了解用户在Web存档中的浏览模式。在Internet Archive的2012年访问日志和2019年访问日志之间,检测到的机器人数量比2019年有更多(请求增加了21%,会话增加18%)。在Arquivo.pt(2019年)中,机器人占请求的98%(会话的97%)。我们发现,2012年的机器人几乎完全局限于“Dip”和“Skim”访问模式,但在2019年的IA中展示了所有模式及其组合。无论是人类还是机器人都更喜欢近期存档的网页。
作者:Himarsha R. Jayanetti, Kritika Garg, Sawood Alam, Michael L. Nelson, Michele C. Weigle
论文ID:2208.12914
分类:Digital Libraries
分类简称:cs.DL
提交时间:2022-11-15