利用维基百科页面快速准确地对短文本进行注释

摘要:解决文本片段与维基百科页面交叉引用的问题: 从长文档注释延伸到搜索引擎结果片段、推文、新闻、博客等短文本注释。设计和构建TAGME系统,能够准确且实时地对这些短文本片段进行注释。大量实验结果显示,TAGME在短文本上的性能优于最先进的算法,并且在长文本上表现出了相对较快、竞争力强的结果。

作者:Paolo Ferragina and Ugo Scaiella

论文ID:1006.3498

分类:Information Retrieval

分类简称:cs.IR

提交时间:2010-07-29

PDF 下载: 英文版 中文版pdf翻译中