大规模受限随机纳什博弈的随机拉格朗日随机近似方法-arXiv论文预印本中文版

大规模受限随机纳什博弈的随机拉格朗日随机近似方法

摘要：随机单调Nash博弈理论的研究中，每个玩家的策略集由可能大量的显式凸约束不等式所定义。特别地，每个玩家的功能约束可能依赖于其他玩家的策略，从而可以捕获广义Nash均衡问题（GNEP）的一类问题。尽管关于这类随机GNEPs的保证性工作有限，即使在玩家的功能约束之间相互独立的情况下，现有方法的大部分仍依赖于使用投影随机逼近（SA）方法。然而，当约束集受到可能的非线性功能不等式的影响时，投影SA方法的性能较差。受到在约束的随机单调Nash博弈中计算纳什均衡的性能保证的缺失的启发，我们开发了一种单时间尺度的随机Lagrangian乘子随机逼近方法，在原始空间中，我们采用SA方案，在对偶空间中，我们采用随机块坐标方案，只更新随机选择的Lagrangian乘子。我们证明了我们的方法在平均意义下对适当定义的亚最优性和不可行性指标实现了收敛速率O(log(k)/sqrt(k))。

作者：Zeinab Alizadeh, Afrooz Jalilzadeh, and Farzad Yousefian

论文ID：2304.07688

分类：Optimization and Control

分类简称：math.OC

提交时间：2023-08-25

PDF 下载： 英文版中文版pdf翻译中