概率计数算法的统计分析

摘要:数据流应用中基数估计问题的处理是本文的研究对象。我们对概率计数算法进行了统计分析,着重讨论了两种利用伪随机变量形成低维数据草图的技术。我们应用传统的统计方法来比较基于存储选定顺序统计量或随机投影的概率算法。我们推导出了这两种情况下的基数估计器,并证明最大项估计器是可递归计算的,并具有指数递减的误差边界。此外,我们还证明了这些估计器具有可比较的渐近效率,并通过展示两种方法之间意外的联系来解释这个结果。

作者:Peter Clifford and Ioana A. Cosma

论文ID:0801.3552

分类:Computation

分类简称:stat.CO

提交时间:2012-11-20

PDF 下载: 英文版 中文版pdf翻译中