数据匿名化中的隐私与效用边界-arXiv论文预印本中文版

数据匿名化中的隐私与效用边界

摘要：在数据发布中，我们考虑隐私问题：给定一个包含敏感信息的关系I，对其进行“匿名化”以获得视图V，使得一方面攻击者无法从V中获取任何敏感信息，另一方面合法用户可以使用V来计算关于I的有用统计信息。这是相互冲突的目标。我们使用一个从现有文献中导出的隐私定义，该定义将给定元组t的先验概率Pr(t)与后验概率Pr(t|V)相关联，并提出了一个新颖且非常实用的效用定义。我们的主要结果如下。将I的大小记为n，将I所属域的大小记为m（即n < m），则当先验概率为Pr(t) = Omega(n/sqrt(m))对于某个t时，不存在有用的匿名化算法，而当对于所有元组t，Pr(t) = O(n/m)时，我们提供了一个具体的既保持隐私又有用的匿名化算法。我们的算法与文献中密集研究的k-匿名化算法非常不同，而是基于I的随机删除和插入。

作者：Vibhor Rastogi, Dan Suciu, Sungho Hong

论文ID：cs/0612103

分类：Databases

分类简称：cs.DB

提交时间：2007-05-23

PDF 下载： 英文版中文版pdf翻译中