使用连续一致加权抽样(CCWS)构建K-匿名用户群
摘要:保护用户隐私的同时检索个性化广告活动和创意,数字广告正从基于成员身份转向基于群体身份。在这种身份制度下,需要一个准确高效的群体构建算法来对具有相似特征的用户进行分组。本文提出了一种可扩展的K-匿名群体构建算法,称为连续一致加权采样(CCWS)。所提出的方法将(p-幂)一致加权采样和层次聚类的思想相结合,从而通过对群体大小设置下限来确保K-匿名性。在一个包含7千多万个用户和广告活动的领英数据集上进行的评估表明,CCWS在包括基于哈希的方法(如符号随机投影(SignRP)、最小哈希(MinHash)以及基础的CWS)在内的几种方法上取得了显著改进。
作者:Xinyi Zheng, Weijie Zhao, Xiaoyun Li, Ping Li
论文ID:2304.13677
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-04-27