用实例级队友反馈校正控制临时团队合作中的类型混淆
摘要:为解决协同工作中的类型混淆问题,我们提出了CTCAT方法。该方法从因果推断的角度出发,首先理论上证明了类型混淆现象源于未控制的队友分布所带来的虚假相关性。然后,我们通过对实例进行队友反馈修正,解除了这种相关性。具体而言,CTCAT通过重新加权共享类型内的队友实例之间的交互作用,减小了类型混淆的影响。我们在多个领域,包括经典的临时团队合作任务和实际场景中对CTCAT的效果进行了评估。结果表明,CTCAT对类型混淆的影响具有鲁棒性,而这是以前的研究中未被注意到的,它直接影响到我们训练得到的智能代理的鲁棒性。
作者:Dong Xing, Pengjie Gu, Qian Zheng, Xinrun Wang, Shanqi Liu, Longtao Zheng, Bo An, Gang Pan
论文ID:2306.10944
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2023-06-21