相似搜索中索引结构的搜索效率

摘要:相似性搜索在许多领域中得到应用,包括多语言数据库、计算生物学、模式识别和文本检索。相似性是以距离函数、编辑距离的形式进行度量,在一般度量空间中计算代价昂贵。索引技术可以用来减少距离计算的数量。我们对各种现有的相似性索引结构进行了分析。研究表明,使用已有的索引结构获得的性能不尽人意。我们提出了一种结合了聚类和M树(MTB)特征的索引技术,结果表明这种技术具有更好的性能表现。

作者:Girish Motwani, Sandhya G. Nair

论文ID:cs/0403014

分类:Databases

分类简称:cs.DB

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中