纯文本中的上下文和关键词提取:基于图表示
摘要:文档索引是由档案管理员或自动索引工具完成的重要任务。为了检索与查询相关的文件,必须仔细选择描述该文件的关键词。在开始提取关键词之前,档案管理员必须确定文件的正确主题。对于专门索引文件的档案管理员来说,经验起着重要的作用。但是,对于不同主题的文件进行索引要困难得多。本文提出了一种创新的索引支持系统方法。该系统以本体论和纯文本文档作为输入,并提供文档的上下文化关键词作为输出。通过利用维基百科的分类链接作为术语本体资源,对该方法进行了评估。
作者:Carlo Abi Chahine (LITIS), Nathalie Chaignaud (LITIS), Jean-Philippe Kotowicz (LITIS), Jean-Pierre P''ecuchet (LITIS)
论文ID:0912.1421
分类:Information Retrieval
分类简称:cs.IR
提交时间:2009-12-09