生物医学知识图谱负面陈述的基准数据集

摘要:负面陈述在知识图谱中非常稀少但却具有高度相关性,在开放世界假设下被证明可以改善各种应用程序的性能,特别是在生物医学领域。然而,目前没有任何基准数据集来评估考虑这些负面陈述的方法。我们提供了一个数据集合,用于三个关系预测任务-蛋白质相互作用预测、基因疾病关联预测和疾病预测-旨在解决在具有负面陈述的知识图谱上构建基准测试的困难。这些数据集包括来自两个成功的生物医学本体-基因本体和人类表型本体的数据,并且还包含负面陈述。我们还使用两种流行的基于路径的方法为每个数据集生成知识图谱嵌入,并评估每个任务的性能。结果显示,负面陈述可以提高知识图谱嵌入的性能。

作者:Rita T. Sousa, Sara Silva, Catia Pesquita

论文ID:2307.11719

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-07-24

PDF 下载: 英文版 中文版pdf翻译中