广义形式博弈中带有调解者的多项式时间最优均衡-arXiv论文预印本中文版

广义形式博弈中带有调解者的多项式时间最优均衡

摘要：对于广义博弈中相关均衡的常见概念，计算最优均衡（例如，最大福利）是NP难问题。其他均衡概念——通信均衡（Forges 1986）和认证均衡（Forges和Koessler 2005）——通过引入一个中介者来增强游戏，该中介者具有发送和接收来自玩家的消息的能力，并且特别地，能够记住这些消息。在本文中，我们从计算的角度研究了广义博弈中的这两个概念。我们证明这两个概念下的最优均衡可以在多项式时间内计算，后者需要在文献中已知的一个自然附加假设下。我们的证明通过构建一个多项式大小的中介者增强游戏来实现，该增强游戏明确表示了中介者的决策和行动。我们的框架允许我们通过改变中介者的信息划分、玩家的撒谎能力和玩家的偏离能力来定义一个完整的均衡系列。从这个角度来看，我们证明其他均衡概念，如广义博弈中的相关均衡，对应于中介者的不完美记忆。这表明，至少在所有这些均衡概念中，计算的难度是由于中介者的不完美记忆。作为我们一般构造的特殊情况，我们恢复了Conitzer＆Sandholm（2004）的用于自动化机制设计的多项式时间算法，用于Bayes-Nash均衡，以及Zhang等人（2022）的用于最佳相关性的相关DAG算法。当均衡概念是我们定义的完全认证均衡，即玩家无法撒谎关于他们的信息，但可以保持沉默时，我们的算法特别可扩展。我们通过在一套标准基准博弈上进行实验证明了我们的理论主张。

作者：Brian Hu Zhang, Tuomas Sandholm

论文ID：2206.15395

分类：Computer Science and Game Theory

分类简称：cs.GT

提交时间：2022-12-02

PDF 下载： 英文版中文版pdf翻译中