具有分布鲁棒机会约束的马尔科夫决策过程及其Kullback-Leibler散度

摘要:具有随机奖励和模糊奖励分布的分布鲁棒的概率约束马尔可夫决策过程的研究

作者:Tian Xia, Jia Liu, Abdel Lisser

论文ID:2305.02167

分类:Optimization and Control

分类简称:math.OC

提交时间:2023-08-01

PDF 下载: 英文版 中文版pdf翻译中