具有微分包含的异步随机逼近
摘要:异步随机逼近的渐近伪轨迹方法在带有集值平均场的情况下得到了扩展。将过程的异步性纳入到平均场中,从而产生了与等价同步过程相似的收敛结果。此外,这也使得之前与异步随机逼近相关的许多限制性假设得以取消。该框架还被扩展为具有集值平均场的耦合的异步随机逼近过程。在这里,我们使用了类似于Borkar在该领域的原始工作中的双时间尺度论证。通过在马尔可夫决策过程中进行学习,证明了该方法的适用性。
作者:Steven Perkins and David S. Leslie
论文ID:1112.2288
分类:Machine Learning
分类简称:stat.ML
提交时间:2011-12-13