SayCanPay: 使用可学习的领域知识的大型语言模型的启发式规划-arXiv论文预印本中文版

SayCanPay: 使用可学习的领域知识的大型语言模型的启发式规划

摘要：使用大型语言模型（LLM）的广泛"世界知识"已经展示出令人印象深刻的规划能力。然而，尽管最近取得了一些进展，但是获得既可行（基于可承受性），又具有成本效益（在计划长度上）的计划仍然是一个挑战。这与利用领域知识（在PDDL等行动模型中形式化）和启发式搜索生成可行最优计划的启发式规划方法形成对比。受到此启发，我们提出了通过利用LLM的世界知识和启发式搜索原理来结合LLM和启发式规划的方法。我们的方法SayCanPay利用LLM生成行动（Say），并由可学习的领域知识评估行动的可行性（Can）和长期奖励/回报（Pay），然后通过启发式搜索选择最佳的行动序列。我们的贡献是：（1）在启发式规划的背景下创新的LLM规划问题表述；（2）将根据可行性和成本效益的要素整合到生成的计划中；（3）使用启发式搜索来搜索行动。我们进行了广泛的评估，结果显示我们的模型超过了其他LLM规划方法。

作者：Rishi Hazra, Pedro Zuidberg Dos Martires, Luc De Raedt

论文ID：2308.12682

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-08-25

PDF 下载： 英文版中文版pdf翻译中