拥塞博弈中的半匪帮动力学:收敛到纳什均衡和无懊悔保证

摘要:一种可用于拥塞博弈的在线梯度下降新变体的引入及实质性证明。该方法收敛于纳什均衡,并在半-决策反馈设定下同时实现了次线性遗憾。所提出的方法收敛速率仅多项式依赖于参与者数量和设施数量,而不依赖于动作集合的大小,后者在设施数量上可能呈指数级增长。此外,我们的方法的运行时间多项式依赖于对游戏的隐式描述。因此,我们的工作回答了Du等人(2022年)中的一个未解之问。

作者:Ioannis Panageas, Stratis Skoulakis, Luca Viano, Xiao Wang, Volkan Cevher

论文ID:2306.15543

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-06-28

PDF 下载: 英文版 中文版pdf翻译中