对列表内距离和离散度的重要重新审视

摘要:推荐结果的多样化是应对用户信息需求不确定性的一种有希望的方法。在多样化推荐中,定义和优化适当的多样性目标特别重要。在本研究中,我们重新审视了最流行的多样性目标:列表内距离(ILD),即所选项目之间的平均两两距离,以及相似但较少人知的分散度目标,即最小两两距离。由于其简洁和灵活性,ILD和分散度在众多多样化推荐研究中得到广泛应用。然而,我们实际上并不知道它们喜欢什么样的项目。我们从理论和实验的角度对ILD和分散度进行了重要的重新审视。我们的理论结果揭示了这些目标的潜在缺陷:ILD可能选择非常接近的重复项目,而分散度可能忽略远离的项目对。作为ILD和分散度的竞争者,我们设计了一个称为高斯ILD的多样性目标,可以通过调整带宽参数在ILD和分散度之间插值。我们通过使用真实数据的实验结果验证了我们的理论结果,并确认了ILD和分散度在实践中的极端行为。

作者:Naoto Ohsaka, Riku Togashi

论文ID:2305.13801

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-05-24

PDF 下载: 英文版 中文版pdf翻译中