通过资源感知的客户端部署实现联邦学习的高吞吐量仿真-arXiv论文预印本中文版

通过资源感知的客户端部署实现联邦学习的高吞吐量仿真

摘要：流联合学习（FL）是一种保护隐私的机器学习范式，能够在数百万个设备之间进行协作模型训练。模拟环境对于大规模FL研究至关重要，它可以让研究人员快速测试解决系统和统计异质性问题的新想法。本文提出了一种名为Pollen的新型资源感知系统，能够通过有效地将客户端分布在分布式和异构硬件中来加速FL仿真。我们提出了减少服务器-GPU通信并基于FL客户端在异构GPU上固有的权衡来使用高效的客户端布置策略。这些权衡是通过实验进行的。通过在三个流行的FL任务（图像分类、语音识别和文本生成）上进行相关基线比较，我们将Pollen与现有的临时FL框架（如Flower、Flute和FedScale）进行比较，并展示了50%至400%的性能提升。

作者：Lorenzo Sani, Pedro Porto Buarque de Gusm~ao, Alex Iacob, Wanru Zhao, Xinchi Qiu, Yan Gao, Javier Fernandez-Marques and Nicholas Donald Lane

论文ID：2306.17453

分类：Distributed, Parallel, and Cluster Computing

分类简称：cs.DC

提交时间：2023-07-03

PDF 下载： 英文版中文版pdf翻译中