控制的顺序蒙特卡罗-arXiv论文预印本中文版

控制的顺序蒙特卡罗

摘要：连续蒙特卡罗方法是一组流行的技术，用于近似高维概率分布及其归一化常数。这些方法在统计学和相关领域中找到了许多应用，例如非线性非高斯状态空间模型推断和复杂静态模型。与许多蒙特卡罗抽样方案一样，它们依赖于关键影响性能的提议分布。我们在这里介绍了一类受控连续蒙特卡罗算法，其提议分布由使用迭代方案近似解决相关最优控制问题的方法确定。该方法建立在计量经济学、物理学和统计学中用于状态空间模型推断的多种现有算法基础上，并推广这些方法以适应复杂的静态模型。我们提供了关于这种方法的波动和稳定性的理论分析，这也提供了对相关算法属性的洞察。我们在各种应用中证明了在固定计算复杂度下与最先进方法相比的显著提升。

作者：Jeremy Heng, Adrian N. Bishop, George Deligiannidis, Arnaud Doucet

论文ID：1708.08396

分类：Computation

分类简称：stat.CO

提交时间：2021-06-23

PDF 下载： 英文版中文版pdf翻译中