利用本机XML数据库增强内容和结构信息检索
摘要:该论文分析了内容和结构XML检索的三种方法:第一种是使用完整文本信息检索系统Zettair; 第二种是使用本地XML数据库eXist; 第三种是使用混合XML检索系统,该系统利用eXist从Zettair检索到的可能相关文章生成最终答案。INEX 2003的内容和结构主题可以分为两类:第一类以完整文章作为最终答案,第二类以文章中的更具体元素作为最终答案。我们展示了对于这两类主题,我们的初始混合系统提高了本地XML数据库的检索效果。对于排名最终答案元素,我们提出并评估了一种利用本地XML数据库答案元素之间的结构关系的新型检索模型,并检索到一致的检索元素。我们实验的最终结果表明,当XML检索任务侧重于高度相关的元素时,我们的混合XML检索系统与一致检索元素模块比Zettair更有效1.8倍,比eXist更有效3倍,实现了有效的内容和结构XML检索。
作者:Jovan Pehcevski (RMIT), James A. Thom (RMIT), Anne-Marie Vercoustre
论文ID:cs/0508017
分类:Information Retrieval
分类简称:cs.IR
提交时间:2007-05-23