重复随机博弈的多项式时间纳什均衡算法
摘要:多项式时间算法总是能找到一个(近似的)重复博弈中的纳什均衡。该算法利用民族定理推导出一种策略配置,通过威胁加固双方互利行为,以增加可能性。我们算法的一个组成部分是有效地搜索公平点的近似解,即最公平的帕累托有效解。文章最后将该算法应用于一组格子游戏,以展示算法找到的典型解。这些解与竞争算法找到的解相比,非常有优势,能够获得更高的社会福利,并保证计算效率。
作者:Enrique Munoz de Cote, Michael L. Littman
论文ID:1206.3277
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2012-06-18