智能网卡优化联邦学习服务器的论据

摘要:在本文中,我们针对联邦学习中的网络处理负载问题,使用NVIDIA BlueField-2 DPU作为智能网卡,将联邦学习服务器卸载至DPU。通过使用DPDK进行任务划分和调度,将处理器核心专用于接收本地权重参数和发送全局参数。同时,通过利用DPU上的多个核心进行并行化处理,进一步提高了性能。此外,我们还实现了一种近似设计,通过消除计算线程之间的独占访问控制来进一步改善性能。实验结果表明,相较于主机CPU,基于DPU的联邦学习服务器可以提高执行时间1.32倍,且准确率损失可以忽略不计。

作者:Naoki Shibahara, Michihiro Koibuchi, Hiroki Matsutani

论文ID:2307.06561

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-07-14

PDF 下载: 英文版 中文版pdf翻译中