结构学习中的基本和高效模式发现

摘要:自动学习在AI中是一个核心问题,对神经符号AI和统计关系学习等领域至关重要。它的目标是从数据中自动学习一个逻辑理论。结构学习的基础是在数据中挖掘重复的模式,也称为结构图案。找到这些模式可以减少指数级的搜索空间,从而引导公式的学习。尽管模式学习的重要性,但它仍然不是很明确。我们提出了第一个系统化的方法,用于在显性图模型中挖掘结构图案,这些图模型融合了一阶逻辑与概率模型,并使用随机过程来度量数据中实体之间的相似性。我们的第一个贡献是一个算法,它依赖于两个直观的超参数:一个用于控制实体相似性度量中的不确定性,另一个用于控制生成规则的柔软度。我们的第二个贡献是一个预处理步骤,在其中我们对数据进行层次聚类,以将搜索空间缩小到最相关的数据。我们的第三个贡献是引入一种O(n ln n)(根据数据中实体的大小)的算法,用于聚类结构相关的数据。我们使用标准基准测试了我们的方法,并显示在准确性和运行时间方面,我们的方法优于最先进的结构学习方法,提高了6%的准确性和80%的运行时间。

作者:Jonathan Feldstein, Dominic Phillips and Efthymia Tsamoura

论文ID:2302.04599

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-06-21

PDF 下载: 英文版 中文版pdf翻译中