异质信念与网络博弈中的多群体学习
摘要:多智能体学习中的种群异质性效应在实践中具有相关性,但远未被充分理解。出于这个动机,我们引入了一种多种群学习模型,允许每个种群内部存在异质性信念,并且智能体通过平滑虚构博弈(SFP)对其信念做出回应。我们展示了系统状态(一种信念的概率分布)根据类似于通常描述物理系统中传输现象的偏微分方程系统演化。我们证明了SFP收敛于捕捉网络竞争和网络协调的各类游戏中的量化响应均衡。我们还证明了在所有网络游戏中,信念最终会同质化。尽管初始信念的异质性在极限状态下消失,但我们证明它在协调游戏中对均衡选择起到关键作用,因为它有助于选择高度理想的均衡。相反,在网络竞争的情况下,极限行为不受信念初始化的影响,即使基础游戏有许多不同的纳什均衡。
作者:Shuyue Hu, Harold Soh, Georgios Piliouras
论文ID:2301.04929
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2023-01-13