云中日志结构化表的基准测试：LST-Bench-arXiv论文预印本中文版

云中日志结构化表的基准测试：LST-Bench

摘要：日志结构化表（LSTs），也通常称为表格格式，最近出现，旨在为对象存储带来一致性和隔离性。随着计算和存储的分离，对象存储已成为高度可扩展和持久的存储选择。然而，这也带来了一系列挑战，如传统数据库管理系统提供的恢复和并发管理的缺失。这就是LSTs（如Delta Lake、Apache Iceberg和Apache Hudi）发挥作用的地方，它们提供了一个自动的元数据层，用于管理基于对象存储定义的表格，有效地解决了这些挑战。这种系统设计的范式转变需要更新评估方法。在本文中，我们研究了LSTs的特性，并提出扩展现有基准测试的方法，包括工作负载模式和指标，以准确捕捉其性能。我们介绍了我们的框架LST-Bench，该框架使用户能够执行专为LSTs评估量身定制的基准测试。我们的评估演示了这些基准测试如何用于评估LSTs的性能、效率和稳定性。LST-Bench的代码是开源的，可以在https://github.com/microsoft/lst-bench/上获得。

作者：Jes''us Camacho-Rodr''iguez, Ashvin Agrawal, Anja Gruenheid, Ashit Gosalia, Cristian Petculescu, Josep Aguilar-Saborit, Avrilia Floratou, Carlo Curino, Raghu Ramakrishnan

论文ID：2305.01120

分类：Databases

分类简称：cs.DB

提交时间：2023-05-03

PDF 下载： 英文版中文版pdf翻译中