无限概率数据库

摘要:概率数据库(PDBs)以量化的方式模拟数据中的不确定性。在已经建立的形式框架中,概率(关系)数据库是有限的概率空间,用于表示关系数据库实例。这种有限性可能与直观的查询行为(Ceylan等人,KR 2016)以及更适合连续概率分布建模的应用场景(Dalvi等人,CACM 2009)相冲突。我们在(Grohe和Lindner,PODS 2019)中正式引入了无限PDBs,主要关注可数无限空间。然而,超出可数概率空间的扩展引发了与事件和查询的可测性以及最终查询是否具有明确定义的语义相关的非平凡基础问题。我们认为有限点过程是概率论中适用于处理通用概率数据库的合适模型。这使我们能够以系统的方式构建适当的(不可数)数据库实例的概率空间。我们的主要技术结果是关系代数查询、聚合查询和Datalog查询的可测性陈述。

作者:Martin Grohe and Peter Lindner

论文ID:2011.14860

分类:Databases

分类简称:cs.DB

提交时间:2023-06-22

PDF 下载: 英文版 中文版pdf翻译中