离散时间下的马尔可夫均衡控制存在性
摘要:对于离散时间和有限时间段内的非时间一致随机控制问题,Bj"ork和Murgoci(Finance Stoch,2014)提出了一个开放问题,即均衡控制的存在性。如果目标在每个时间步骤中是inf紧致的,则存在一个非随机Borel可测Markov均衡策略。我们提供了一个充分条件,从而实现了inf紧致性和存在性,其中成本是下半连续(l.s.c.)并且从下面有界,转换核在给定状态下对控制连续。控制空间不需要是紧的。
作者:Erhan Bayraktar and Bingyan Han
论文ID:2308.07227
分类:Optimization and Control
分类简称:math.OC
提交时间:2023-08-15