一种基于主成分分析的用于合成数据评估的新型效用度量
摘要:数据合成是一项增强隐私的技术,旨在在实际数据难以获取时生成逼真而及时的数据。通过不同的效用度量,已经对合成数据生成器(SDG)的实用性进行了研究。这些指标已经发现会产生相互冲突的结论,使得直接比较SDG变得非常困难。此外,先前的研究发现流行的度量之间没有相关性,得出结论它们解决了不同的效用维度。本文将四个流行的效用度量(代表不同的效用维度)通过主成分分析聚合成一个,并检查新的测量是否能生成在现实生活中表现良好的合成数据。新的测量方法用于比较四个公认的SDG。
作者:F. K. Dankar, M. K. Ibrahim
论文ID:2212.05595
分类:Databases
分类简称:cs.DB
提交时间:2022-12-13