CAPS:一种用于过滤相似性搜索的实用分区索引
摘要:使用近似最近邻搜索(ANNS)的普及,由于神经表征学习的进展,伴随一组约束条件进行查询的能力已成为一个热点领域。尽管近期社区提出了几种用于受约束ANNS的算法,几乎所有这些方法都集中在与基于图的索引的集成上,后者是在延迟和召回之间达到最优性能的主要算法类别。在这项工作中,我们采用了一种不同的方法,重点发展了一种基于空间划分的受约束ANNS算法,而不是图。为此,我们引入了约束近似划分搜索(CAPS)索引,通过空间划分实现ANNS与过滤器,并且不仅能保留基于划分的算法的优点,而且在召回-延迟权衡方面优于最先进的基于图的受约束搜索技术,仅使用10\%的索引大小。
作者:Gaurav Gupta, Jonah Yi, Benjamin Coleman, Chen Luo, Vihan Lakshman, Anshumali Shrivastava
论文ID:2308.15014
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-08-30