在具有结构假设的分散环境中评估链路遍历查询执行
摘要:应对Web上的数据孤岛引起的社会和经济问题,诸如Solid之类的努力通过将数据存储在跨Web上的大量个人存储库中的经许可文件中来重新获取私有数据。 在这种分散的知识图上构建应用程序涉及重大的技术挑战:基于法律原因,排除了查询处理之前的集中聚合,并且当前的联合查询技术无法处理预期性能下的此种分布规模。 我们提出了一种扩展Link Traversal Query Processing(LTQP)的方法,该方法在分散环境中结合了结构性质,以应对其前所未有的规模。 在本文中,我们分析了对查询执行相关的Solid分散生态系统的结构特性,并提供了SolidBench基准来代表性地模拟Solid环境。 我们引入了利用这些结构特性的新颖LTQP算法,并评估了它们的有效性。我们的实验证明,这些新算法可以在非复杂查询的情况下在几秒钟内获得准确的结果,而现有算法无法实现。 此外,我们讨论了处理更复杂查询方面的局限性。这项工作揭示了使用结构性假设的遍历型查询方法在大规模分散化中可以是有效的,但在LTQP的查询规划领域需要进一步的进展来处理更复杂的查询。 这些见解为基于查询的分散应用程序打开了大门,其中声明性查询使开发人员免受分散化景观的固有复杂性的影响。
作者:Ruben Taelman, Ruben Verborgh
论文ID:2302.06933
分类:Databases
分类简称:cs.DB
提交时间:2023-02-15