基于强化学习的D2D支持联邦学习中图形发现方法
摘要:增强联合学习(FL)与直接设备到设备(D2D)通信相结合,可以通过快速的本地信息交换改善收敛速度并减少模型偏差。然而,数据隐私问题、设备信任问题和不可靠的无线信道对确定有效且资源高效的D2D结构提出了挑战。在本文中,我们开发了一种去中心化的强化学习(RL)方法来进行D2D图发现,促进非敏感但有影响力的数据点通过可信且可靠的链接进行通信。每个设备充当RL代理,训练一个预测传入链接影响的策略。局部(设备级别)和全局奖励通过设备集群内部和之间的消息传递相结合。数值实验证实了我们方法在多个数据集和FL方案中在收敛速度和容错能力方面所提供的优势。
作者:Satyavrat Wagle, Anindya Bijoy Das, David J. Love, Christopher G. Brinton
论文ID:2308.03933
分类:Signal Processing
分类简称:eess.SP
提交时间:2023-08-09