具有概率不确定性的游戏与部分观测游戏的等价性

摘要:引入了具有概率不确定性的游戏,这是一个自然的控制器综合模型,其中控制器通过不精确的传感器观察系统状态,这些传感器以固定的概率提供关于当前状态的正确信息。 也就是说,在每一步中,传感器返回一个观察到的状态,并且鉴于观察到的状态,实际当前状态存在一个概率分布(由于估计误差)。 控制器必须基于观察到的状态(而不是它不知道的实际当前状态)做出决策。 另一方面,我们假设环境可以完全观察到当前状态。 我们表明,我们的模型可以在多项式时间内简化为标准的部分观察随机游戏(stochastic games),反之亦然。 作为结果,我们确定了新类游戏的准确可判定边界,并为大多数可判定问题建立了最优复杂度结果。

作者:Krishnendu Chatterjee and Martin Chmelik and Rupak Majumdar

论文ID:1202.4140

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2012-07-03

PDF 下载: 英文版 中文版pdf翻译中