基于关键词搜索的XML文档命名空间元素检索

摘要:基于关键字搜索的XML元素查询正逐渐受到欢迎。传统的相似性度量广泛应用于有效地检索各种XML文档。已经有许多作者提出了不同的相似性度量方法,利用XML文档的结构和内容。然而,他们没有考虑查询中元素文本的潜在语义信息和关键字之间的相似性。尽管有许多关于XML元素搜索的算法可用,但其中一些由于搜索大量元素而具有较高的计算复杂度。本文提出了一种新的算法,该算法仅考虑元素之间的语义相似性,而非整个XML文档之间的相似性,同时考虑元素中命名空间的语义信息、XML文档的结构和内容。我们通过在真实数据集上进行测试,将我们的算法与其他三种算法进行比较。实验证明,我们提出的方法能够提高查询准确性,并减少运行时间。

作者:Yang Wang, Zhikui Chen, Xiaodi Huang

论文ID:1012.3805

分类:Information Retrieval

分类简称:cs.IR

提交时间:2010-12-20

PDF 下载: 英文版 中文版pdf翻译中