拥挤博弈中的并发模仿动态

摘要:模仿成功的行为是一种自然且经常应用的方法,面对我们没有以其为基础做出决策的经验来基于决定我们可以信任的情况。在本文中,我们考虑这种行为在原子拥塞博弈中的应用。我们建议研究并发的模仿动态,当每个玩家采样另一个玩家并可能在预期的延迟增益足够大的情况下模仿该玩家的策略时,这些动态将会产生。我们的主要重点是收敛性质。通过使用潜能函数参数,我们展示了我们的动态以单调的方式收敛到稳定状态。在这样的状态下,没有一个玩家能够通过模仿他人来改善其延迟。作为我们的主要结果,我们展示了快速收敛到近似均衡。在近似均衡下,只有很少一部分的代理人的延迟显著高于或低于平均值。特别是,模仿动态表现出完全多项式时间逼近方案(FPTAS)的特性。在固定其他参数的情况下,收敛时间只以对数函数的形式依赖于代理人的数量。由于模仿过程是没有创新性的,所以它们无法发现未使用的策略。此外,策略可能以非零的概率消失。对于单例博弈的情况,我们证明这种事件发生的概率是可以忽略的。此外,我们证明了我们的动态达到的稳定状态的社会成本不会比具有线性延迟函数的单例拥塞博弈中的最优状态差太多。最后,我们讨论了如何扩展该协议,使得在长期内动态收敛到纳什均衡。

作者:Heiner Ackermann, Petra Berenbrink, Simon Fischer, Martin Hoefer

论文ID:0808.2081

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2008-10-04

PDF 下载: 英文版 中文版pdf翻译中