云中日志结构化表的基准测试:LST-Bench
摘要:日志结构化表(LSTs),也通常称为表格格式,最近出现,旨在为对象存储带来一致性和隔离性。随着计算和存储的分离,对象存储已成为高度可扩展和持久的存储选择。然而,这也带来了一系列挑战,如传统数据库管理系统提供的恢复和并发管理的缺失。这就是LSTs(如Delta Lake、Apache Iceberg和Apache Hudi)发挥作用的地方,它们提供了一个自动的元数据层,用于管理基于对象存储定义的表格,有效地解决了这些挑战。这种系统设计的范式转变需要更新评估方法。在本文中,我们研究了LSTs的特性,并提出扩展现有基准测试的方法,包括工作负载模式和指标,以准确捕捉其性能。我们介绍了我们的框架LST-Bench,该框架使用户能够执行专为LSTs评估量身定制的基准测试。我们的评估演示了这些基准测试如何用于评估LSTs的性能、效率和稳定性。LST-Bench的代码是开源的,可以在https://github.com/microsoft/lst-bench/上获得。
作者:Jes''us Camacho-Rodr''iguez, Ashvin Agrawal, Anja Gruenheid, Ashit Gosalia, Cristian Petculescu, Josep Aguilar-Saborit, Avrilia Floratou, Carlo Curino, Raghu Ramakrishnan
论文ID:2305.01120
分类:Databases
分类简称:cs.DB
提交时间:2023-05-03