数据集群中交付和编码策略的延迟比较
摘要:云基础设施的一个关键功能是存储和传递各种文件,例如科学数据集、社交网络信息、视频等。在这种系统中,为了实现快速可靠的传递,文件被划分为块,复制或纠删码,并分散在服务器上进行传播。目前尚不清楚延迟如何随请求的大小而扩展,也不知道在编码、数据传播和传递的不同策略下延迟如何相比。 受到这些问题的启发,我们开发和探索一套演化方程作为一个统一的模型,以捕捉上述特点。这些方程允许在一般统计假设下对几个传递策略进行高效模拟和数学分析。特别是,我们量化了一个工作负载感知的传递策略相对于一个无工作负载感知策略的优越性。在动态或随机的环境中,这些策略的样本路径比较一般不成立。该比较被证明在较弱的递增凸型随机排序下成立,仍然比平均值比较更强。 这个结果进一步使我们能够获得有见地的可计算性能界限。例如,我们展示了在一个系统中,文件被划分为相等大小的块、复制或纠删码,并随机分布在服务器上时,作业延迟对于小型和中型文件的请求大小呈亚对数增长,而对于大文件则呈线性增长。
作者:Virag Shah, Anne Bouillard, Francois Baccelli
论文ID:1706.02384
分类:Performance
分类简称:cs.PF
提交时间:2017-06-12