资源感知的异构策略适应联盟形成-arXiv论文预印本中文版

资源感知的异构策略适应联盟形成

摘要：合作形成现有方法通常假设人类操作员明确规定了与任务相关的需求。然而，先前的工作表明，人类虽然在解决复杂问题方面非常擅长，但很难明确陈述他们的解决策略。此外，现有方法经常忽略了专家可能利用不同但同样有效的解决方案（即异质策略）来解决相同的问题。在这项工作中，我们提出了一个由两部分组成的框架来解决这些挑战。首先，我们解决了直接从专家合作形成演示中推断隐含策略的挑战。为此，我们将这些异质策略建模为与每个任务相关的基于能力的需求，并进行推断。接下来，我们提出了一种能够自适应地选择最适合目标团队的推断策略而无需额外培训的方法。具体来说，我们制定并解决了一个受限优化问题，该问题同时在给定目标团队能力的情况下选择最合适的策略，并将其成员分配到适当的合作伙伴。我们通过详细的数值模拟、《星际争霸II》战斗和多机器人应急响应场景来评估我们的方法与几种基线方法的性能。我们的结果表明，我们的框架在需求满足、资源利用和任务成功率等方面始终优于所有基线方法。

作者：Anusha Srikanthan and Harish Ravichandar

论文ID：2108.02733

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2022-01-26

PDF 下载： 英文版中文版pdf翻译中