注入的一次性延迟在集群上的传播和衰减:一个案例研究

摘要:分布式内存应用程序的分析和基于第一原理的性能建模很困难,因为应用程序和系统造成了广泛的随机干扰。这些干扰(通常称为“噪音”)破坏了通常在构建简单分析模型时使用的规则性假设。尽管有许多工作试图量化、分类和减少这些效应,但对它们的性能影响没有全面的定量理解,特别是对于对并行应用程序具有全局影响的长延迟。在这项工作中,我们使用模拟和真实消息传递系统上的合成基准测试收集的各种跟踪来确定延迟传播背后的机制。我们分析了从注入的延迟发出的空闲波的传播速度与应用程序的执行和通信属性的依赖关系,研究了这些延迟在增加的噪音水平下的衰减情况,以及它们如何相互作用。我们还展示了细粒度噪音如何使系统免受传播的空闲波的负面影响。我们的结果有助于更好地理解在分布式内存并行应用程序中表现的集体现象。

作者:Ayesha Afzal, Georg Hager, Gerhard Wellein

论文ID:1905.10603

分类:Performance

分类简称:cs.PF

提交时间:2020-06-25

PDF 下载: 英文版 中文版pdf翻译中