通过同时在线双平均法计算拍卖游戏中的贝叶斯纳什均衡策略

摘要:拍卖模型被建模为具有连续类型和行动空间的贝叶斯博弈。一般而言,在拍卖博弈中确定均衡是计算上困难的,且没有已知的精确解理论。我们引入了一种算法框架,在其中我们离散化类型和行动空间,然后通过在线优化算法学习分布策略。分布策略的一个优点是我们不需要对出价函数的形状做任何假设。此外,代理的期望效用在策略中是线性的。由此可知,如果我们的优化算法收敛到一个纯策略,那么它们会以高精度收敛到离散化游戏的近似均衡。重要的是,我们展示了离散化游戏的均衡近似于连续游戏中的均衡。在各种各样的拍卖博弈中,我们提供了实证证据表明该方法与分析(纯)贝叶斯纳什均衡非常接近。这种速度和精度是了不起的,因为在许多有限游戏中,学习动态不会收敛,甚至是混沌的。在代理对称的标准模型中,我们可以在几秒钟内找到均衡。虽然我们专注于对偶平均,但我们证明了整体方法收敛与正则化项无关,而且替代的在线凸优化方法也可以获得类似的结果,尽管离散化游戏既不满足全局的单调性,也不满足变分稳定性。该方法允许相互关联的估值和不同类型的效用函数,并为广泛适用的均衡求解器提供了基础,可以推动拍卖市场及其他领域均衡分析的边界。

作者:Martin Bichler, Maximilian Fichtl, Matthias Oberlechner

论文ID:2208.02036

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-05-10

PDF 下载: 英文版 中文版pdf翻译中