非光滑系统的随机最优控制中正态分布的近似传播
摘要:通过使用一种近似方法,我们提出了一种在具有不连续右手边的常微分方程(ODE)中传播概率分布的均值和协方差的方法。对于分段仿射系统,我们在每个时间步骤对传播的概率分布进行归一化,这使我们能够在明确考虑不连续性的情况下理论计算均值和协方差动力学的期望积分。这导致了对不连续性的自然平滑化,以至于对于相关的不确定性水平,结果的ODE可以直接使用标准方案进行积分,而不需要预先指定切换顺序或使用切换检测方法。然后,我们展示了如何将这个结果应用于基于结构保持线性化方案的分段平滑函数的更一般情形。由此产生的动态可以直接在具有机会限制的随机最优控制问题的标准表述中使用。
作者:Florian Messerer, Katrin Baumg"artner, Armin Nurkanovi''c, Moritz Diehl
论文ID:2308.03431
分类:Optimization and Control
分类简称:math.OC
提交时间:2023-08-08