SC-PSRO:一种用于正态形式博弈的统一策略学习方法

摘要:SC-PSRO:自确认策略空间反馈Oracle:一种解决正规形式游戏中纳什均衡的创新统一的开放式学习框架

作者:Yudong Hu, Haoran Li, Congying Han, Tiande Guo, Mingqiang Li, Bonan Li

论文ID:2308.12520

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-08-25

PDF 下载: 英文版 中文版pdf翻译中