测量线程时序以评估提前发送消息的可行性

摘要:早期通信是一种将细粒度通信与分区通信相结合的通信/计算重叠技术,以提高应用程序的运行时间。通信被分配给计算线程,以便每个线程在完成自己的数据部分后立即启动数据传输,而不需要等待所有线程完成。然而,早期通信的好处取决于各个线程的完成时间。在本文中,我们测量和评估各个线程在完成计算和最后一个线程完成之间的空闲时间,以了解给定应用程序是否可以从早期通信中受益。我们提出了一种收集这些数据的技术,并评估了从三个代理应用程序(MiniFE,MiniMD和MiniQMC)收集到的数据。为了表征这些工作负载的行为,我们以宏观水平(即在应用程序的所有运行中跨所有线程)和微观水平(即在单个运行的单个进程中)研究线程的计时。我们观察到这些应用程序展现出明显不同的行为。尽管由于线程分布更广和滞后线程更频繁,MiniFE和MiniQMC似乎很适合使用早期通信,但是MiniMD的行为可能限制了它利用早期通信的能力。

作者:W. Pepper Marts, Matthew G. F. Dosanjh, Whit Schonbein, Scott Levy, Patrick G. Bridges

论文ID:2304.11122

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-04-24

PDF 下载: 英文版 中文版pdf翻译中