计算分箱泄漏总和的置信区间
摘要:计算期望的错误分类结果数量是一种常见的问题,对于稀有事件的搜索尤为重要。Clopper-Pearson方法允许在数据全部来自同一二项分布时计算经典置信区间中的错误分类数量。然而,数据通常更好地被分成几个箱子,每个箱子由不同的二项分布表示。我们描述并提供了一种算法,用于基于校准数据计算多个箱子中预期总错误分类事件的经典置信区间,校准数据的误分类概率基于逐个箱子的基础。我们的方法通过引入拉格朗日乘数并进行标准根查找来避免了计算密集型的多维搜索。这种方法的时间复杂度仅为二次,与箱子的数量成正比,并且产生的置信区间略微保守。
作者:Ian Ruchlin, Richard W. Schnee
论文ID:1106.6296
分类:Data Analysis, Statistics and Probability
分类简称:physics.data-an
提交时间:2011-11-15