匿名数据的效用能被用于隐私泄露吗?

摘要:基于群体的匿名化是隐私保护数据发布的最广泛研究方法。这包括了k-匿名、l-多样性和t-接近等方法。本文旨在提出当前基于群体方法的隐私曝光的一个基本问题,这在过去被忽视了。基于群体的匿名化方法基本上是通过将每个个体记录隐藏在一个群体后面来保护数据隐私。如果匿名化不当,实际上可以从已发布的数据中推断出模式,并由对手用于侵犯个人隐私。例如,从已发布的医疗记录中,如果可以推断出某些国家的人很少患某种疾病的模式,那么这些信息可以用来暗示在一个匿名群组中有更高可能性患有这种疾病的其他人的关联性。我们称从已发布的数据中推断出的模式为前景知识,与对手可能从其他渠道获取的背景知识形成对比,这些知识在之前的一些研究中已经进行了研究。最后,我们通过实验证明,在传统的基于群体的匿名化方法下,这种攻击是现实的,在隐私基准数据集上可以成功进行。

作者:Raymond Chi-Wing Wong, Ada Wai-Chee Fu, Ke Wang, Yabo Xu, Philip S. Yu

论文ID:0905.1755

分类:Databases

分类简称:cs.DB

提交时间:2009-05-13

PDF 下载: 英文版 中文版pdf翻译中