通过语义消歧增强文本以进行信息提取
摘要:外部语言资源在信息提取中已经有很长时间的应用。这些方法用于将语义上等效的数据丰富到文档中,以提高召回率。例如,其中一些方法使用同义词词典。这些词典用具有相似含义的词汇丰富一句话。然而,这些方法存在一些严重的缺点,因为词语通常只在特定的语境中是同义词。我们在这里提出的方法是使用词义消歧规则(WSD)将同义词的选择限定为仅与特定的句法和语义上下文匹配的词语。我们展示了如何构建WSD规则,并展示了信息提取技术如何从应用这些规则中受益。
作者:Bernard Jacquemin (ISC), Caroline Brun, Claude Roux
论文ID:cs/0506048
分类:Information Retrieval
分类简称:cs.IR
提交时间:2007-05-23