摘要:具有随机奖励和模糊奖励分布的分布鲁棒的概率约束马尔可夫决策过程的研究
作者:Tian Xia, Jia Liu, Abdel Lisser
论文ID:2305.02167
分类:Optimization and Control
分类简称:math.OC
提交时间:2023-08-01
PDF 下载: 英文版 中文版pdf翻译中