多臂赌博机中高效沟通的合作后悔最小化

摘要:在本论文中,我们研究了协同学习模型,重点关注多智能体多臂赌博机中并行和通信开销之间的权衡。为了在多臂赌博机中实现遗憾最小化,我们提出了协同学习过程中智能体通信轮数和遗憾之间的第一批权衡。

作者:Nikolai Karpov, Qin Zhang

论文ID:2301.11442

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-15

PDF 下载: 英文版 中文版pdf翻译中