高效迭代程序与分布式数据集合

摘要:大数据编程框架在对性能和可伸缩性要求高的应用程序开发中变得越来越重要。在这些复杂的框架中,手工优化代码很困难和耗时,因此自动化优化变得特别必要。为了实现自动化优化,先决条件是找到适合表示程序的抽象方法;例如,基于单子或幂等元的代数来表示分布式数据集合。然而,目前这样的代数不能以允许分析或重写的方式表示递归程序。在本文中,我们通过添加一个递归的不动点操作符来扩展幂等元代数,以便将递归作为一种特殊类型的程序进行表示,并展示了它如何实现新的优化。使用Spark平台进行的实验证明了这些系统优化所带来的性能提升。

作者:Sarah Chlyah, Nils Gesbert, Pierre Geneves, Nabil Layaida

论文ID:2306.07690

分类:Logic in Computer Science

分类简称:cs.LO

提交时间:2023-06-14

PDF 下载: 英文版 中文版pdf翻译中