基于决策市场的多智能体上下文强盗问题学习
摘要:使用模拟研究决策市场作为一种机制,以在多智能体学习系统中汇集分布式信息以进行决策。该系统利用严格恰当的决策评分规则评估智能体的概率报告的准确性,使智能体能够共同学习解决上下文强盗问题。我们的模拟表明,我们的多智能体系统能够像接收所有信息的单一智能体的集中对应物一样高效地进行训练。此外,我们使用我们的系统来研究具有确定性决策评分规则的情景,这些规则不具有激励兼容性。我们观察到出现了更复杂的动态行为,这与现有的理论分析一致。
作者:Wenlong Wang and Thomas Pfeiffer
论文ID:2212.00271
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2022-12-02