RiverBench:一个开放的RDF流式基准套件
摘要:RDF数据流已经在语义Web社区中从多个角度进行了探索,导致了多个任务的制定和流式处理方法。然而,对于许多现有的问题形式,由于缺乏描述清晰且适当多样的基准数据集,可靠地对流式处理解决方案进行基准测试一直是具有挑战性的。现有数据集和评估,除了一些值得注意的案例外,存在流式任务范围不明确、基准规范不明确以及数据错误等问题。为了解决这些问题,我们首先以明确的分类系统对不同的RDF数据流任务进行了系统化,并提出了基准数据集的实际要求。然后,我们提出了RiverBench,一个开放和协作的RDF流式处理基准套件,将这些原则应用到实践中。RiverBench利用持续的、社区驱动的流程、已建立的最佳实践(例如FAIR)和内置的质量保证。该套件以通用的、可访问的格式分发数据集,并提供清晰的文档、许可和可机读的元数据。目前的发布版本包括由语义Web社区生成的多样化的非合成数据集,代表了RDF数据流的许多应用、所有主要的任务形式和新兴的RDF功能(RDF-star)。最后,我们提供了该套件的研究应用列表,展示了它的多功能性和价值,甚至超出了RDF数据流的范畴。
作者:Piotr Sowinski, Maria Ganzha, Marcin Paprzycki
论文ID:2305.06226
分类:Databases
分类简称:cs.DB
提交时间:2023-05-11