在马尔可夫决策过程中,以稳定性为代价的交易表现
摘要:有限状态Markov决策过程的中央控制器综合问题的复杂性研究 稳定性定义的替代方式及其表达方式 期望平均收益和稳定性的优化问题 确定是否存在达到预定界限下的期望平均收益和方差的策略 关于全局方差、混合方差和局部方差问题的决策问题 在特殊情况下,要求给定的期望平均收益和方差为零时的问题的多项式时间解法
作者:Tom''av{s} Br''azdil, Krishnendu Chatterjee, Vojtv{e}ch Forejt, Anton''in Kuv{c}era
论文ID:1305.4103
分类:Systems and Control
分类简称:cs.SY
提交时间:2013-05-20