结构等价的并发奇偶博弈的鲁棒性

摘要:两人随机博弈是在有限状态空间上进行的,轮数为无穷大。这些博弈是并发的:在每一轮中,两个玩家(玩家1和玩家2)独立地同时选择他们的移动;当前状态和两个移动确定了对后继状态的概率分布。我们还考虑了重要的特殊情况,即基于回合制的随机博弈,玩家按照轮次进行移动,而不是同时进行。我们研究了具有奇偶正则获胜条件的并发博弈。对于奇偶正则获胜条件,玩家1的值是其可以保证满足该目标的最大概率,不管对手采取何种策略。我们研究了在转移概率的不确定性下,值函数在并发和基于回合制的随机奇偶博弈中的连续性和鲁棒性问题。我们给出了值函数差异的量化界限(以转移概率的不确定性为基础),并展示了结构等价的并发博弈的值连续性(如果两个游戏的转移函数的支持相同但概率不同,则它们是结构等价的)。我们还展示了结构等价的基于回合制随机奇偶博弈的最优策略的鲁棒性。最后,我们展示了值连续性性质在没有结构等价假设(即使对于马尔可夫链也是如此)的情况下会被打破,并展示了我们的量化界限的渐近最优性。因此,我们的结果是最紧密的(假设是必要的且充分的)和最优的(我们的量化界限是渐近最优的)。

作者:Krishnendu Chatterjee

论文ID:1107.2009

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2012-01-04

PDF 下载: 英文版 中文版pdf翻译中