网络数据仓储
摘要:数据仓库中的数据准备阶段对于实现多维分析或使用数据挖掘算法来说,可以在时间和性能方面带来显著的收益。此外,数据仓库可能需要外部数据,而在这种情况下,Web是一种普遍的数据来源。本文中,我们提出了一种用于将不同和异构(所谓的多格式)数据集成到统一格式中的建模过程。此外,数据仓库上下文中的很多架构定义提供了一流的元数据。在概念层次上,复杂对象采用UML表示。我们的逻辑模型是一个可以用DTD或XML-Schema语言描述的XML模式。最后,我们设计了一个Java原型,将我们的多格式输入数据转换为表示物理模型的XML文档。然后,我们获得的XML文档将被映射到一个关系数据库中,我们将其视为ODS(操作数据存储),其内容将需要以多维的方式重新进行建模,以便在基于星型架构的数据仓库中进行存储和后续分析。
作者:J''er^ome Darmont (ERIC), Omar Boussa"id (ERIC), Fadila Bentayeb (ERIC)
论文ID:0705.1456
分类:Databases
分类简称:cs.DB
提交时间:2007-05-23