突触:利用少样本示例实现人类级计算机控制
摘要:通过提示大型语言模型 (LLMs),本文研究了用于计算机自动化的少样本示例的设计。虽然之前的提示方法注重于自我修正,但我们发现充分结构化的示例单独就足以达到人类水平的性能。我们提出了Synapse,一个在MiniWob++基准测试中展示了人类水平性能的上下文计算机控制代理。Synapse包括三个主要组成部分:1)状态条件分解,根据代理对新环境状态的需求将演示分解为示例集,实现时间抽象;2)结构化提示,过滤状态并重新构造每个集合的任务描述,以提高规划正确性;3)示例检索,将传入任务与示例数据库中的相应示例关联,实现多任务适应和推广。Synapse克服了上下文长度限制,减少了多步控制中的错误,并允许在上下文中使用更多示例。重要的是,Synapse补充了现有的提高LLMs推理和规划能力的提示方法。Synapse在MiniWob++的63个任务中,成功率平均为98.5%,优于以往的方法,包括行为克隆、强化学习、微调和提示。值得注意的是,Synapse仅依赖于47个任务的示例,展示了对新任务的有效泛化能力。我们的结果突显了上下文学习在将LLMs集成到实际工具自动化中的潜力。
作者:Longtao Zheng, Rundong Wang, Bo An
论文ID:2306.07863
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-06-14