一种基于主成分分析的用于合成数据评估的新型效用度量

摘要:数据合成是一项增强隐私的技术,旨在在实际数据难以获取时生成逼真而及时的数据。通过不同的效用度量,已经对合成数据生成器(SDG)的实用性进行了研究。这些指标已经发现会产生相互冲突的结论,使得直接比较SDG变得非常困难。此外,先前的研究发现流行的度量之间没有相关性,得出结论它们解决了不同的效用维度。本文将四个流行的效用度量(代表不同的效用维度)通过主成分分析聚合成一个,并检查新的测量是否能生成在现实生活中表现良好的合成数据。新的测量方法用于比较四个公认的SDG。

作者:F. K. Dankar, M. K. Ibrahim

论文ID:2212.05595

分类:Databases

分类简称:cs.DB

提交时间:2022-12-13

PDF 下载: 英文版 中文版pdf翻译中