生成对抗平衡求解器

摘要:使用生成对抗学习方法来计算一般博弈论情境中的均衡,具体来说是伪博弈中的广义纳什均衡(GNE),以及其在Arrow-Debreu竞争经济中的具体实现,即竞争均衡(CE)。伪博弈是对博弈的一般化,其中玩家的行动不仅影响其他玩家的收益,还影响它们的可行行动空间。虽然在最坏情况下GNE和CE的计算是难以解决的,即PPAD难题,但在实践中,许多应用只需要在问题实例的分布上具有高精度的解决方案。我们引入了生成对抗均衡求解器(GAES):一系列生成对抗神经网络,它可以从一组问题实例的样本中学习GNE和CE。我们提供了计算和样本复杂性的边界,并将该框架应用于在正态博弈中找到纳什均衡,在Arrow-Debreu竞争经济中找到CE,以及在京都机制的环境经济模型中找到GNE。

作者:Denizalp Goktas and David C. Parkes and Ian Gemp and Luke Marris and Georgios Piliouras and Romuald Elie and Guy Lever and Andrea Tacchetti

论文ID:2302.06607

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-02-21

PDF 下载: 英文版 中文版pdf翻译中