突触：利用少样本示例实现人类级计算机控制-arXiv论文预印本中文版

突触：利用少样本示例实现人类级计算机控制

摘要：通过提示大型语言模型 (LLMs)，本文研究了用于计算机自动化的少样本示例的设计。虽然之前的提示方法注重于自我修正，但我们发现充分结构化的示例单独就足以达到人类水平的性能。我们提出了Synapse，一个在MiniWob++基准测试中展示了人类水平性能的上下文计算机控制代理。Synapse包括三个主要组成部分：1）状态条件分解，根据代理对新环境状态的需求将演示分解为示例集，实现时间抽象；2）结构化提示，过滤状态并重新构造每个集合的任务描述，以提高规划正确性；3）示例检索，将传入任务与示例数据库中的相应示例关联，实现多任务适应和推广。Synapse克服了上下文长度限制，减少了多步控制中的错误，并允许在上下文中使用更多示例。重要的是，Synapse补充了现有的提高LLMs推理和规划能力的提示方法。Synapse在MiniWob++的63个任务中，成功率平均为98.5%，优于以往的方法，包括行为克隆、强化学习、微调和提示。值得注意的是，Synapse仅依赖于47个任务的示例，展示了对新任务的有效泛化能力。我们的结果突显了上下文学习在将LLMs集成到实际工具自动化中的潜力。

作者：Longtao Zheng, Rundong Wang, Bo An

论文ID：2306.07863

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-06-14

PDF 下载： 英文版中文版pdf翻译中