维基百科文章的链接预测作为自然语言推理任务
摘要:链接预测任务对于自动了解大型知识库的结构至关重要。本文介绍了我们在数据科学和高级分析2023比赛“高效和有效的链接预测”(DSAA-2023比赛)中提出的系统,该系统使用包含948,233个训练集和238,265个公共测试集的语料库来解决此任务。本文将链接预测问题转化为维基百科文章的自然语言推理(NLI)任务。受到自然语言处理和理解领域最新进展的启发,我们将链接预测视为一个NLI任务,其中将两篇文章之间的链接存在视为前提,任务是根据文章中所提供的信息来确定这个前提是否成立。我们基于维基百科文章链接预测的句对分类任务实现了我们的系统。我们的系统在公共和私有测试集上分别取得了0.99996的宏F1分数和1.00000的宏F1分数。我们的UIT-NLP团队在私有测试集上排名第三,与第一名和第二名的分数相同。我们的代码公开用于研究目的。
作者:Chau-Thang Phan, Quoc-Nam Nguyen, Kiet Van Nguyen
论文ID:2308.16469
分类:Computation and Language
分类简称:cs.CL
提交时间:2023-09-01