IR模型与COVID-19大流行:绩效和挑战的比较研究
摘要:COVID-19大流行期间,不同信息检索(IR)系统在访问科学文献中的相关信息方面的效率进行了研究。该研究应用了TREC框架于COVID-19开放研究数据集(CORD-19),评估了BM25、Contriever和Bag of Embeddings IR框架。研究的目标是构建一个应对疫情期间复杂信息景观的搜索引擎测试集合。研究使用CORD-19数据集来训练和评估IR模型,并将结果与TREC-COVID IR Challenge中手动标记的结果进行比较。结果表明,像BERT和Contriever这样的高级IR模型在疫情期间更好地检索相关信息。然而,研究还强调了处理大型数据集的挑战以及需要关注摘要或总结的策略。总体而言,该研究强调了在应对COVID-19等危机期间有效定制的IR系统的重要性,并可以指导未来在这个领域的研究和开发。
作者:Moksh Shukla, Nitik Jain, Shubham Gupta
论文ID:2305.12528
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-05-23