广义条件梯度和潜在均场博弈中的学习
摘要:使用广义条件梯度算法(Frank-Wolfe算法的延伸)研究了二阶、势能、单调均值场博弈的解决方案。我们证明了该方法与虚拟对弈方法等价。我们对不同步长选择下的最优性差距、可利用性和变量与均值场博弈唯一解的距离的收敛率进行了建模。特别地,我们表明当通过线搜索计算步长时可以实现线性收敛。
作者:Pierre Lavigne and Laurent Pfeiffer
论文ID:2209.12772
分类:Optimization and Control
分类简称:math.OC
提交时间:2023-08-22