提取带有标记联合的JSON模式
摘要:从JSON数据集中提取描述性模式对于数据湖和无模式NoSQL文档存储来说是一个严峻的挑战。在本文中,我们针对标记联合的发现展开研究,标记联合是一种JSON模式设计模式,其中对象的一个属性值(标记)有条件地暗示了同级属性的子模式。我们将这些暗示形式化为条件函数依赖,并使用JSON模式的操作符if-then-else来捕捉它们。我们进一步阐述了避免过拟合的启发式方法的动机。我们的原型实现的实验结果是令人鼓舞的,并且表明这种形式的标记联合在真实的GeoJSON和TopoJSON数据集中可以成功检测到。在讨论未来的工作时,我们概述了如何进一步扩展我们的方法。
作者:Stefan Klessinger, Meike Klettke, Uta St"orl, Stefanie Scherzinger
论文ID:2306.07085
分类:Databases
分类简称:cs.DB
提交时间:2023-06-13