广义形式博弈中带有调解者的多项式时间最优均衡
摘要:对于广义博弈中相关均衡的常见概念,计算最优均衡(例如,最大福利)是NP难问题。其他均衡概念——通信均衡(Forges 1986)和认证均衡(Forges和Koessler 2005)——通过引入一个中介者来增强游戏,该中介者具有发送和接收来自玩家的消息的能力,并且特别地,能够记住这些消息。在本文中,我们从计算的角度研究了广义博弈中的这两个概念。我们证明这两个概念下的最优均衡可以在多项式时间内计算,后者需要在文献中已知的一个自然附加假设下。我们的证明通过构建一个多项式大小的中介者增强游戏来实现,该增强游戏明确表示了中介者的决策和行动。我们的框架允许我们通过改变中介者的信息划分、玩家的撒谎能力和玩家的偏离能力来定义一个完整的均衡系列。从这个角度来看,我们证明其他均衡概念,如广义博弈中的相关均衡,对应于中介者的不完美记忆。这表明,至少在所有这些均衡概念中,计算的难度是由于中介者的不完美记忆。作为我们一般构造的特殊情况,我们恢复了Conitzer&Sandholm(2004)的用于自动化机制设计的多项式时间算法,用于Bayes-Nash均衡,以及Zhang等人(2022)的用于最佳相关性的相关DAG算法。当均衡概念是我们定义的完全认证均衡,即玩家无法撒谎关于他们的信息,但可以保持沉默时,我们的算法特别可扩展。我们通过在一套标准基准博弈上进行实验证明了我们的理论主张。
作者:Brian Hu Zhang, Tuomas Sandholm
论文ID:2206.15395
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2022-12-02