学习联合查询解释和响应排序
摘要:信息提取和语义Web技术的发展使得在非结构化文本上进行搜索越来越依赖于语义标注和结构化知识库。然而,大多数用户无法熟悉知识库的架构并提出结构化查询。将自由格式的查询解释为更结构化的表达方式目前备受关注。主导的范式是通过用途对查询令牌进行分割或分区(引用类型、实体、属性名称、属性值、关系),然后在结构化知识库上进行解释查询。鉴于结构化知识提取永远不完整,我们在此使用一种数据表示方法,该方法保留了非结构化文本语料库以及针对其的结构化注释(实体和关系的提及)。我们提出了两种新的、自然的查询解释和响应排序的方法,这两种方法利用了知识库和语料库之间的双向信息流。一种方法受概率语言模型的启发,计算了基于查询解释的不确定性的预期响应得分。另一种方法基于最大间隔判别学习,使用潜变量表示这些不确定性。在类型化实体搜索的背景下,这两种方法在不约束类型的通用查询和由人类提供的"完美"目标实体类型之间填补了相当大的准确性差距。我们的方法也优于先使用最近的查询类型预测技术选择目标类型,然后发起类型限制的实体搜索查询的两阶段方法。
作者:Uma Sawant and Soumen Chakrabarti
论文ID:1212.6193
分类:Information Retrieval
分类简称:cs.IR
提交时间:2012-12-27