数据匿名化中的隐私与效用边界

摘要:在数据发布中,我们考虑隐私问题:给定一个包含敏感信息的关系I,对其进行“匿名化”以获得视图V,使得一方面攻击者无法从V中获取任何敏感信息,另一方面合法用户可以使用V来计算关于I的有用统计信息。这是相互冲突的目标。我们使用一个从现有文献中导出的隐私定义,该定义将给定元组t的先验概率Pr(t)与后验概率Pr(t|V)相关联,并提出了一个新颖且非常实用的效用定义。我们的主要结果如下。将I的大小记为n,将I所属域的大小记为m(即n < m),则当先验概率为Pr(t) = Omega(n/sqrt(m))对于某个t时,不存在有用的匿名化算法,而当对于所有元组t,Pr(t) = O(n/m)时,我们提供了一个具体的既保持隐私又有用的匿名化算法。我们的算法与文献中密集研究的k-匿名化算法非常不同,而是基于I的随机删除和插入。

作者:Vibhor Rastogi, Dan Suciu, Sungho Hong

论文ID:cs/0612103

分类:Databases

分类简称:cs.DB

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中