BioBLP:用于多模态生物医学知识图的模块化学习框架
摘要:利用实体属性的知识图谱表示学习的模块化框架 我们提出了一种模块化框架,用于学习具有实体属性的知识图谱的表示,该框架允许编码不同模态的属性数据,并支持缺失属性的实体。我们还提出了一种高效的预训练策略,以减少所需的训练时间。我们使用一个包含近200万个三元组的生物医学知识图谱训练模型,并评估所得到的实体表示在链接预测和药物-蛋白互作预测任务上的性能,与不考虑属性数据的方法进行比较。在标准的链接预测评估中,所提出的方法与不使用属性数据的基线方法相比具有竞争力但性能较低。在药物-蛋白互作预测任务中,该方法与基线方法相比表现良好。我们发现,在知识图谱中占实体集合相当大比例的低度实体的情况下,我们的方法优于基线方法。我们提出的预训练策略在减少所需的训练时间的同时显著提高了性能。 我们的实现可在https://github.com/elsevier-AI-Lab/BioBLP上找到。
作者:Daniel Daza, Dimitrios Alivanistos, Payal Mitra, Thom Pijnenburg, Michael Cochez, Paul Groth
论文ID:2306.03606
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-06-07