解决可达性博弈的复杂性:价值和策略迭代

摘要:两种标准算法来近似解决两人零和并发可达性博弈:值迭代和策略迭代。我们证明了对于包含N个非终止位置和每个位置每个玩家有m种行动的博弈,这两种算法所需的最坏情况迭代次数的上界和下界为2^(m^(Theta(N)))。特别地,这两种算法都具有双指数复杂度。即使输入的博弈只有一个非终止位置,我们也证明了所需的最坏情况迭代次数的指数下界。

作者:Kristoffer Arnsfelt Hansen and Rasmus Ibsen-Jensen and Peter Bro Miltersen

论文ID:1007.1812

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2012-03-02

PDF 下载: 英文版 中文版pdf翻译中