数据流水线中的进化能力

摘要:数据管道的演变是肯定的,并且随着时间的推移,数据的结构和语义以及管道操作符也会发生演变。处理这些变化,即提供长期维护,是昂贵的。本文探讨了管道框架中对演化能力的需求。在这个背景下,处理演化被定义为一个由自我意识和自适应组成的两步过程。此外,提供了一个概念性的需求模型,该模型包括自我意识和自适应的标准,同时涵盖数据、操作符、管道和环境等方面。现有框架中缺乏这些能力,存在着重大的差距。填补这一差距将对实践者和科学家都有重要贡献。本文设想并奠定了一个可以处理演变性变化的框架的基础。

作者:Kevin Kramer

论文ID:2308.14591

分类:Databases

分类简称:cs.DB

提交时间:2023-08-29

PDF 下载: 英文版 中文版pdf翻译中