Knuth的采样算法D和D'的分析

摘要:流算法中的不同元素估计问题的研究 在这篇研究论文中,我们讨论了流算法中的不同元素估计问题。该问题涉及估计给定数据流mathcal{A} = (a_1, a_2, ..., a_m)中的不同元素数量,其中a_i属于集合{1, 2, ..., n}。在过去的四十年中,不同元素问题得到了相当多的关注,从理论和实证上来看,导致了空间最优算法的发展。一种最近由Chakraborty等人提出的基于采样的算法引起了广泛关注,甚至引起了著名计算机科学家Donald E. Knuth的注意,他在同一主题上撰写了一篇文章,并称该算法为CVM。在本文中,我们对这些算法进行了彻底的研究(在[11]中称为CVM1、CVM2,在[6]中称为DonD、DonD'),首先将它们统一起来并称之为基于截断的算法。然后我们对这些算法进行了近似和有偏性分析。

作者:Mridul Nandi, Soumit Paul

论文ID:2306.05243

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-06-13

PDF 下载: 英文版 中文版pdf翻译中