重复随机博弈的多项式时间纳什均衡算法

摘要:多项式时间算法总是能找到一个(近似的)重复博弈中的纳什均衡。该算法利用民族定理推导出一种策略配置,通过威胁加固双方互利行为,以增加可能性。我们算法的一个组成部分是有效地搜索公平点的近似解,即最公平的帕累托有效解。文章最后将该算法应用于一组格子游戏,以展示算法找到的典型解。这些解与竞争算法找到的解相比,非常有优势,能够获得更高的社会福利,并保证计算效率。

作者:Enrique Munoz de Cote, Michael L. Littman

论文ID:1206.3277

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2012-06-18

PDF 下载: 英文版 中文版pdf翻译中