模型服务应用中硬件加速通信的好处理解

摘要:优化机器学习计算离线流水线中的通信延迟:对GPUDirect RDMA的性能影响的深入洞察

作者:Walid A. Hanafy, Limin Wang, Hyunseok Chang, Sarit Mukherjee, T. V. Lakshman, Prashant Shenoy

论文ID:2305.03165

分类:Performance

分类简称:cs.PF

提交时间:2023-07-11

PDF 下载: 英文版 中文版pdf翻译中