基于KNN的维度数据插补

摘要:数据仓库(DWs)是商业智能(BI)的核心组成部分。数据仓库中缺失的数据对数据分析有很大的影响。因此,需要完成缺失数据。与其他现有主要适用于事实的数据填充方法不同,我们提出了一种新的维度填充方法。该方法包括两个步骤:1)分层填充和2)基于K最近邻(KNN)的填充。我们的解决方案具有考虑数据仓库结构和依赖约束的优势。实验评估确认了我们的方法在有效性和效率方面的验证。

作者:Yuzhao Yang (IRIT), J''er^ome Darmont (ERIC), Franck Ravat (IRIT), Olivier Teste (IRIT)

论文ID:2210.02237

分类:Databases

分类简称:cs.DB

提交时间:2022-10-06

PDF 下载: 英文版 中文版pdf翻译中