用于构建差分隐私的加性噪声机制的随机近似算法

摘要:随着可用数据量的指数级增长,如何在不违反用户隐私的情况下利用这些数据已成为计算机科学的一个基本问题。在差分隐私的框架下,这个问题已经得到了深入研究。然而,大部分文献并没有关注数据量如此之大以至于我们甚至无法在非隐私保护的环境中计算出精确答案的场景(例如在流媒体环境、次线性时间环境等)。这往往使得在实践中使用差分隐私变得不可行。 在本文中,我们展示了一种通用方法,可以使蒙特卡洛随机近似算法具备差分隐私。我们只需要假设近似算法的错误$R$足够集中在0周围(例如$mathbb{E}[|R|]$有界),并且被近似的函数具有较小的全局敏感度$Delta$。具体而言,如果我们有一个具备足够集中错误的随机近似算法,其时间/空间/查询复杂度为$T(n,ho)$,其中$ho$是精度参数,那么通常我们可以获得一个精度相同、复杂度为$T(n,Theta(epsilonho))$的$epsilon$-差分隐私算法。

作者:Jakub Tv{e}tek

论文ID:2211.03695

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-07-19

PDF 下载: 英文版 中文版pdf翻译中