广义条件梯度和潜在均场博弈中的学习-arXiv论文预印本中文版

广义条件梯度和潜在均场博弈中的学习

摘要：使用广义条件梯度算法（Frank-Wolfe算法的延伸）研究了二阶、势能、单调均值场博弈的解决方案。我们证明了该方法与虚拟对弈方法等价。我们对不同步长选择下的最优性差距、可利用性和变量与均值场博弈唯一解的距离的收敛率进行了建模。特别地，我们表明当通过线搜索计算步长时可以实现线性收敛。

作者：Pierre Lavigne and Laurent Pfeiffer

论文ID：2209.12772

分类：Optimization and Control

分类简称：math.OC

提交时间：2023-08-22

PDF 下载： 英文版中文版pdf翻译中