使用基于进程内多对象技术加速MPI集合通信

摘要:提高高性能计算(HPC)应用程序中MPI集合性能的关键在于exascale计算时代。当前的算法面临系统调用开销、页面错误或数据复制延迟导致的性能下降,影响了HPC应用程序的效率和扩展性。为了解决这些问题,我们提出了PiP-MColl,这是一个基于进程内进程的多对象互进程MPI集合设计,可以在规模上最大化小消息的MPI集合性能。PiP-MColl具有高效的多发和多接收集合算法,并利用进程内共享内存技术消除了不必要的系统调用、页面错误开销和额外的数据复制,提高了节点内和节点间的消息传输速率和吞吐量。我们的设计还提升了较大消息的性能,从而为不同的消息大小实现了全面的改进。实验结果表明,PiP-MColl在MPI集合操作(如MPI\_Scatter和MPI\_Allgather)中比流行的MPI库(包括OpenMPI、MVAPICH2和Intel MPI)的性能提高了多达4.6倍。

作者:Jiajun Huang, Kaiming Ouyang, Yujia Zhai, Jinyang Liu, Min Si, Ken Raffenetti, Hui Zhou, Atsushi Hori, Zizhong Chen, Yanfei Guo, Rajeev Thakur

论文ID:2305.10612

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-05-19

PDF 下载: 英文版 中文版pdf翻译中