适应演化开放世界中的领域无关代理体系结构

摘要:基于模型的推理代理在处理环境模型不再充分地代表世界的新颖情境中表现不佳。我们提出了HYDRA - 一个用于设计在混合离散-连续世界中运行的基于模型的代理的框架,它可以自主地检测环境是否从其规范设置演变,理解其演变方式,并适应代理模型以实现有效操作。HYDRA基于PDDL+,这是一种用于在混合离散-连续环境中规划的丰富建模语言。它通过添加视觉推理、任务选择和行动执行模块来扩展规划模块,以在复杂环境中进行闭环交互。HYDRA实现了一种新颖的元推理过程,使代理能够从不同方面监控自己的行为。该过程利用多种计算方法来维护代理在环境中的行为期望。与这些期望的偏差对于检测环境的演变并识别调整基础模型的机会是有用的。HYDRA借鉴了诊断与修复的思想,并使用启发式引导的模型变化搜索,以使其能够在新颖条件下胜任。HYDRA框架已用于实现针对三个不同领域的新颖感知代理 - CartPole++(经典控制问题的高维变体)、Science Birds(IJCAI竞赛问题)和PogoStick(Minecraft中特定的问题领域)。我们通过这些领域的实证观察来证明新颖元推理过程中各组件的有效性。

作者:Shiwali Mohan, Wiktor Piotrowski, Roni Stern, Sachin Grover, Sookyung Kim, Jacob Le, Johan De Kleer

论文ID:2306.06272

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-06-13

PDF 下载: 英文版 中文版pdf翻译中