BOLAA:基于LLM增强的自主代理的基准测试和编排

摘要:大型语言模型(LLMs)的巨大成功鼓励了对LLM增强自主代理(LAAs)的新探索。LAAs能够利用其核心LLM生成行动并与环境交互,从而有助于通过对过去的观察和行动进行条件化来解决复杂任务的能力。由于对LAA的研究还很新颖,因此目前只有有限的探索。因此,我们提供了一项关于代理架构和LLM主干的综合比较。此外,我们提出了一种新策略,以协调多个LAAs,使每个工作LAAs专注于一种类型的行动,即BOLAA,其中控制器管理多个代理之间的通信。我们在决策制定和多步推理环境中进行了模拟,全面验证了LAAs的能力。我们的性能结果为设计LAA体系结构、选择LLMs的最佳选择以及两者的兼容性提供了定量建议。我们将LAAs的实现代码公开发布在https://github.com/salesforce/BOLAA上。

作者:Zhiwei Liu, Weiran Yao, Jianguo Zhang, Le Xue, Shelby Heinecke, Rithesh Murthy, Yihao Feng, Zeyuan Chen, Juan Carlos Niebles, Devansh Arpit, Ran Xu, Phil Mui, Huan Wang, Caiming Xiong, Silvio Savarese

论文ID:2308.05960

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-14

PDF 下载: 英文版 中文版pdf翻译中