使用知识图谱支持异构数据存储的多存储体系结构
摘要:异构数据和模式的管理是现代应用程序常见的需求,这使得在一个统一的方式中访问它们变得困难。在这种情况下,使用一个共同的数据模型来管理异构数据的单一数据存储不够有效,导致领域数据在最适合它们存储和访问需求的数据存储中被分割(例如,NoSQL、关系型数据库管理系统或HDFS)。此外,组织工作流独立地使用这些片段,通常没有明确的连接,这对支持集成视图很有用。本文的研究挑战是提供查询位于不明确连接的不同数据存储库中的异构数据的手段。我们提出了一个联邦数据库架构,通过为用户提供一个抽象的全局概念模式,允许他们编写查询,通过使用以下方法封装数据的异构性,位置和链接:(i)元模型来表示全局概念模式、远程数据本地概念模式和它们之间的映射;(ii)溯源来创建存在于不同数据集中的消耗和生成数据之间的明确链接。我们通过将其实现为一个模块化服务的架构,在石油和天然气行业的真实案例模拟中来评估架构。此外,我们将该架构与基于外部数据包装器的关系多数据库系统进行了比较,衡量了用户编写查询的认知负荷(或查询复杂度)和查询处理时间。结果表明,所提出的架构使查询编写的复杂度比关系多数据库系统少两倍,查询处理时间增加不超过30\%。
作者:Leonardo Guerreiro Azevedo, Renan Francisco Santos Souza, Elton F. de S. Soares, Raphael M. Thiago, Julio Cesar Cardoso Tesolin, Ann C. Oliveira, Marcio Ferreira Moreno
论文ID:2308.03584
分类:Databases
分类简称:cs.DB
提交时间:2023-08-08