QMNet: 分散式多智能体强化学习中重要性感知的信息交流

摘要:通过无线资源的约束,改进多智能体强化学习的性能,我们提出了一种消息重要性度量指标,并设计了一种重要性感知调度策略来有效地交换消息。关键见解是将宝贵的通信资源用于重要消息上。消息的重要性不仅取决于消息本身,还取决于接收消息的智能体的需求。因此,我们提出了一种基于查询消息的架构,称为QMNet。智能体利用环境观察生成查询和消息。共享查询可以帮助计算消息的重要性。交换消息可以帮助智能体更好地合作。此外,我们利用消息的重要性来处理分散系统中的随机接入冲突。此外,还提出一种消息预测机制来弥补未传输消息。最后,在交通路口环境中评估了所提出的方案,在这个环境中,由于有限的无线资源,只有一部分智能体能够发送消息。结果表明,即使只有30%的智能体能够共享消息,QMNet也可以提取有价值的信息来保证系统的性能。通过利用消息的预测,系统可以进一步节省40%的无线资源。重要性感知的分散多接入机制可以有效避免冲突,实现几乎与集中式调度相同的性能。

作者:Xiufeng Huang, Sheng Zhou

论文ID:2307.09051

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-07-19

PDF 下载: 英文版 中文版pdf翻译中