评估和修正给定数据集的覆盖范围

摘要:通过对现有数据集上的分类属性进行评估,我们确定数据覆盖的程度。我们首先提供了有效的技术,用于遍历数值组合的组合爆炸,以确定数据不足覆盖的属性空间区域。然后,我们确定必须获取的最少额外数据量以解决数据不足的问题。我们通过理论分析和对真实数据的综合实验来验证我们方案的价值。

作者:Abolfazl Asudeh, Zhongjun Jin, H. V. Jagadish

论文ID:1810.06742

分类:Databases

分类简称:cs.DB

提交时间:2023-04-27

PDF 下载: 英文版 中文版pdf翻译中