在多智能体隐藏角色游戏中学会欺骗

摘要:在人类社交环境中,欺骗是普遍存在的。然而,对欺骗对强化学习算法的影响的研究仅限于简单环境,限制了它们在复杂实际问题中的应用。本文通过引入一种新的混合竞争合作多智能体强化学习(MARL)环境,该环境受到人气角色欺骗游戏(如狼人杀、阿瓦隆和Among Us)的启发,来解决这个问题。环境的独特挑战在于必须在不知道其他智能体是朋友还是敌人的情况下与其合作。此外,我们引入了一种欺骗模型,称为贝叶斯信念操纵(BBM),并展示了它在该环境中欺骗其他智能体的有效性,同时也提高了欺骗智能体的性能。

作者:Matthew Aitchison, Lyndon Benke, Penny Sweetser

论文ID:2209.01551

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2022-09-07

PDF 下载: 英文版 中文版pdf翻译中