贝叶斯定位、滤波和受控感知POMDP中的凸随机优势
摘要:贝叶斯定位和最优滤波中,提供了观测概率分布条件,使得条件均值估计满足凸随机支配。凸支配允许我们比较两个最优贝叶斯状态估计器的无条件均方误差,而不是使用蛮力蒙特卡洛计算。证明使用了微观经济学中的两个关键思想,即积分精确支配和单交叉的聚合。然后利用凸支配结果给出了控制感知的两状态部分观测马尔可夫决策过程(POMDP)的最优策略的足够条件,使其下界为近视策略。数值例子展示了使用一个传感器的观测分布的香农容量优于另一个,且凸支配成立而布莱克韦尔支配不成立。这些例子说明了主要结果在定位、滤波和控制感知应用中的有用性。
作者:Vikram Krishnamurthy
论文ID:1904.00287
分类:Systems and Control
分类简称:cs.SY
提交时间:2019-10-29