关于数值微观数据的统计披露控制中有界距离信息损失度量的注释

摘要:统计披露控制领域中,数据保密性和数据效用之间的权衡通过比较风险披露和信息损失度量来衡量。基于距离的度量方法,如平均绝对误差(MAE)、均方误差(MSE)、均方差(IL1)及其缩放版本(IL1s)是数值微观数据的常用信息损失度量。然而,这些度量方法不可被限制,这使得难以将其与通常介于0和1之间的风险披露度量进行比较。在本研究中,我们提出了MAE和MSE度量的基于排名的版本,其在与风险披露度量相同范围内限制。我们通过一系列实验将所提出的有限度量与基于距离的度量进行了实证比较,其中度量方法评估了多个被掩盖数据集,这些数据集是通过应用越来越多的扰动(例如,增加噪声)生成的。我们的研究结果表明,所提出的有界度量方法与传统度量方法产生类似的排序(通过斯皮尔曼相关系数衡量),表明它们是当前在统计披露控制文献中使用的基于距离的信息损失度量工具箱的可行补充。

作者:Elias Chaibub Neto

论文ID:2305.07846

分类:Applications

分类简称:stat.AP

提交时间:2023-05-16

PDF 下载: 英文版 中文版pdf翻译中