平均场博弈的经验性博弈论分析

摘要:基于仿真的平均场博弈问题(MFGs)求解方法——经验博弈论分析(EGTA)框架。利用双博弈者的版本,通过迭代地添加基于到目前为止考虑的策略中平衡点的最佳反应的策略来完成主要方法。我们将虚拟博弈(FP)和重复器动力学作为计算经验博弈均衡的两个子程序进行介绍。每个子程序都采用基于查询的方法来实现,而不是像典型的EGTA方法那样维护一个明确的收益矩阵,这是由于我们在MFG中强调的表示问题。通过引入游戏模型学习和正则化,我们明显提高了主要方法的样本效率,而不会牺牲整体学习性能。从理论上讲,我们证明了在经验MFG中存在纳什均衡(NE),并展示了迭代EGTA收敛到完整MFG的NE的过程,无论是使用哪个子程序。我们在各种游戏中测试了迭代EGTA的性能,并展示了它在引入策略的迭代次数方面优于直接将FP应用于MFGs的效果。

作者:Yongzhao Wang, Michael P. Wellman

论文ID:2112.00900

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2023-02-14

PDF 下载: 英文版 中文版pdf翻译中