因果性数据整合
摘要:因果推断对自然科学和社会科学的实证科学发现至关重要;然而,在进行因果推断的过程中,数据管理问题可能导致错误的发现。其中两个问题是(i)没有所有分析所需的属性,以及(ii)错误地确定要包含在分析中的属性。分析师通常只能获得部分数据,并且他们在确定要包括在分析中的属性时,严重依赖于(通常不可用或不完整的)领域知识,这些知识通常以因果有向图的形式给出。我们认为数据管理技术可以克服这两个挑战。在这项工作中,我们引入了因果数据集成(CDI)问题,其中从外部数据源中挖掘未观察到的属性,并自动构建相应的因果有向图。我们确定了在设计CDI系统时面临的关键挑战和研究机会,并提出了解决CDI问题的系统架构。我们的初步实验结果表明,解决CDI是可行的,并为未来研究铺平了道路。
作者:Brit Youngmann, Michael Cafarella, Babak Salimi, and Anna Zeng
论文ID:2305.08741
分类:Databases
分类简称:cs.DB
提交时间:2023-05-16