多智能体对未知环境进行高效的Q学习和访问频率地图勘探

摘要:机器人探索任务已广泛研究,应用领域涵盖了从新环境映射到物品配送的各种任务。对于一些时间关键的任务,如救援灾难,需要机器人尽可能高效地进行探索。最近,基于访问频率的地图表示在这些场景中取得了巨大成功,通过使用基于频率的惩罚来阻止重复访问。然而,其相对较大的尺寸和单一代理设置阻碍了其进一步的发展。在这种背景下,我们提出了综合访问频率地图,它以更紧凑的尺寸编码了与访问频率地图相同的信息,并提出了基于访问频率的多代理信息交换和控制方案,能够容纳这两种表示。通过在不同的设置中进行测试,结果表明我们提出的方法能够在较低的带宽要求下实现与访问频率地图相当的性能,并且能够很好地适应包括真实环境在内的不同多代理设置。

作者:Xuyang Chen, Ashvin N. Iyer, Zixing Wang, Ahmed H. Qureshi

论文ID:2307.16318

分类:Robotics

分类简称:cs.RO

提交时间:2023-08-01

PDF 下载: 英文版 中文版pdf翻译中