多智能体系统中合成无限时域目标的弹性策略
摘要:合成鲁棒和随机稳定策略的问题,对于在已知环境中努力最小化相继访问选定位置的预期时间,我们考虑合作代理系统。如果策略配置即使有些代理失败也能保持其功能性,则该策略配置是鲁棒的;如果访问时间的方差较小,则该策略配置是随机稳定的。我们设计了一个新颖的目标规范语言,展示了如何高效地计算优化这些目标的策略配置(适用于自主和协调代理)。实验证明我们的策略合成算法可以为具有一般拓扑结构的环境构建非常复杂和高效的策略配置。
作者:David Klav{s}ka and Anton''in Kuv{c}era and Martin Kurev{c}ka and V''it Musil and Petr Novotn''y and Vojtv{e}ch v{R}eh''ak
论文ID:2305.10070
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2023-05-18