在维基百科文章中快速连接数学维基数据实体 使用注解推荐

摘要:数学信息检索(MathIR)应用程序,如语义公式搜索和问答系统,依赖于将数学表达式与其自然语言名称进行链接的知识库。对于数据库填充,需要对数学公式进行注释并将其链接到语义概念,这是非常耗时的。在本文中,我们提出了一种支持注解者的方法来结构化和加速这个过程,该方法通过提供公式名称和数学标识符的含义建议系统来帮助注解者。我们在https://en.wikipedia.org上测试了我们的方法,并评估了注释建议的质量和时间节省情况。此外,我们观察了编辑器对维基百科公式实体链接和维基数据条目创建和填充的撤销和评论,以为公式语义提供实际依据。我们的评估结果显示,AI指导能够将公式的注释过程加速1.4倍,标识符加速2.4倍。在一个月的测试窗口内,我们的贡献被撤销了12%的编辑维基百科文章和33%的维基数据项。>>AnnoMathTeX<<注释推荐系统由Wikimedia托管在https://annomathtex.wmflabs.org。将来,我们的数据细化流程准备无缝集成到维基百科用户界面中。

作者:Philipp Scharpf and Moritz Schubotz and Bela Gipp

论文ID:2104.05111

分类:Digital Libraries

分类简称:cs.DL

提交时间:2021-04-13

PDF 下载: 英文版 中文版pdf翻译中