结构化Web查询的高效查询重写

摘要:Web搜索引擎和专业的在线垂直领域越来越多地整合了来自结构化数据源的结果,以回答语义丰富的用户查询。例如,查询WebQuery{Samsung 50英寸led电视}可以使用来自电视数据表的信息来回答。然而,用户不是领域专家,往往输入与基础数据不完全匹配的值。三星制造46或55英寸的led电视,但没有50英寸的。因此,对上述查询的文字执行将返回零个结果。为了实现最佳的用户体验,搜索引擎希望返回至少与原始查询尽可能接近的最少数量的结果。此外,由于Web搜索的典型快速检索速度,搜索引擎的查询执行是有时间限制的。 在本文中,我们提出了一种有原则的算法来解决这些挑战,以便在满足低延迟约束的同时,至少提供所需数量的结果。我们对这些要求进行了形式化,并介绍了问题的一般形式。我们表明,在自然形式化下,问题是NP-Hard难解的,并且提出了一种产生良好重写的近似算法。我们在商业搜索引擎的购物垂直领域上从大规模数据上对我们的算法进行了经验证实。

作者:Sreenivas Gollapudi, Samuel Ieong, Alexandros Ntoulas, Stelios Paparizos

论文ID:1108.2685

分类:Information Retrieval

分类简称:cs.IR

提交时间:2011-08-15

PDF 下载: 英文版 中文版pdf翻译中