评估干扰下新兴深度学习、图形和高性能计算工作负载的性能
摘要:通过在同一台机器上同时运行多个应用程序来实现吞吐量导向计算已被广泛应用于现代超级计算机和数据中心,以实现高硬件利用率和节能。然而,有效地同时运行应用程序会带来新的设计挑战,主要是因为具有不同需求的应用程序可以在各个级别上对共享硬件资源(IO、网络和缓存)施加压力。资源使用的差异可能导致干扰,反过来可能导致不可预测的并行行为。为了更好地理解应用干扰,先前的研究提供了详细的执行特征描述。然而,这些特征描述方法要么强调传统基准测试,要么陷入单一应用领域。为了解决这个问题,我们研究了25个最新的应用程序和基准测试,并形成了625个合并对,以彻底分析应用程序并行运行所引起的执行干扰。此外,我们利用小型基准测试和实际应用程序来确定硬件和软件方面并行干扰的出处。
作者:Hao Xu, Shuang Song, Ze Mao
论文ID:2303.15763
分类:Performance
分类简称:cs.PF
提交时间:2023-03-29