二人回合制随机博弈中,具有恒定折扣因子的策略迭代是强多项式时间复杂度的

摘要:强多项式时间复杂度下的带折扣因子的马尔可夫决策过程的解决算法研究和改进

作者:Thomas Dueholm Hansen, Peter Bro Miltersen, Uri Zwick

论文ID:1008.0530

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2010-08-04

PDF 下载: 英文版 中文版pdf翻译中