知识图谱实体对齐的匹配算法基准研究

摘要:如何识别知识图谱(KGs)之间的等价实体,即实体对齐(EA),是一个长期存在的挑战。到目前为止,已经提出了许多方法,最近的重点是利用深度学习来解决这个问题。然而,我们观察到大部分的努力都是为了更好地表示实体,而不是改进从学到的表示中的实体匹配。事实上,如何从这个相似性矩阵中有效地推断出实体对,这本质上是一个匹配问题,已经在学术界中被大大忽视了。受到这个观察的启发,我们对已有的特别设计用于解决这个匹配问题的算法进行了深入分析,并提出了一种新的匹配方法,名为双向匹配(BMat)。我们在公共数据集上进行了大量实验,结果表明目前还没有适用于EA的单一解决方案。换句话说,不同类别的实体相似性估计可能需要不同的匹配算法才能获得最佳的EA结果。最后,我们得出结论,在EA性能和算法的时间和空间复杂性方面,使用PARIS作为最先进的EA方法,并结合BMat是最佳的组合。

作者:Nhat-Minh Dao, Thai V. Hoang, Zonghua Zhang

论文ID:2308.03961

分类:Databases

分类简称:cs.DB

提交时间:2023-08-09

PDF 下载: 英文版 中文版pdf翻译中