广义条件梯度和潜在均场博弈中的学习

摘要:使用广义条件梯度算法(Frank-Wolfe算法的延伸)研究了二阶、势能、单调均值场博弈的解决方案。我们证明了该方法与虚拟对弈方法等价。我们对不同步长选择下的最优性差距、可利用性和变量与均值场博弈唯一解的距离的收敛率进行了建模。特别地,我们表明当通过线搜索计算步长时可以实现线性收敛。

作者:Pierre Lavigne and Laurent Pfeiffer

论文ID:2209.12772

分类:Optimization and Control

分类简称:math.OC

提交时间:2023-08-22

PDF 下载: 英文版 中文版pdf翻译中