SC-PSRO：一种用于正态形式博弈的统一策略学习方法-arXiv论文预印本中文版

SC-PSRO：一种用于正态形式博弈的统一策略学习方法

摘要：SC-PSRO：自确认策略空间反馈Oracle：一种解决正规形式游戏中纳什均衡的创新统一的开放式学习框架

作者：Yudong Hu, Haoran Li, Congying Han, Tiande Guo, Mingqiang Li, Bonan Li

论文ID：2308.12520

分类：Computer Science and Game Theory

分类简称：cs.GT

提交时间：2023-08-25

PDF 下载： 英文版中文版pdf翻译中