DPXPlain: 私密解释聚合查询答案
摘要:差分隐私(DP)是回答聚合数据库查询并保护数据中敏感信息隐私的最先进和严格的隐私概念。然而,在当今数据分析时代,它给用户理解查询结果中观察到的趋势和异常提出了新的挑战:意外的答案是由于数据本身还是由于必须添加的额外噪声以保护DP?在第二种情况下,用户对查询结果的观察甚至可能是错误的。在第一种情况下,我们是否仍然可以从敏感数据中挖掘有趣的解释,同时保护其隐私?为了解决这些挑战,我们提出了一个三阶段的框架DPXPlain,据我们所知,这是第一个在回答具有DP的分组聚合查询答案时进行解释的系统。在它的三个阶段中,DPXPlain (a) 使用DP回答分组聚合查询, (b) 允许用户比较两个组的聚合值,并以高概率评估此比较是否保持或受DP噪声的影响翻转, (c) 最终提供一个包含近似“top-k”解释谓词的解释表,以及其相对影响和排名的置信区间形式,同时保证DP在所有步骤中。我们对DPXPlain进行了广泛的实验分析,使用了真实和合成数据的多个用例,结果显示DPXPlain在提供有洞察力且准确性和实用性良好的解释方面效果显著。
作者:Yuchao Tao, Amir Gilad, Ashwin Machanavajjhala, Sudeepa Roy
论文ID:2209.01286
分类:Databases
分类简称:cs.DB
提交时间:2022-09-07