SayCanPay: 使用可学习的领域知识的大型语言模型的启发式规划

摘要:使用大型语言模型(LLM)的广泛"世界知识"已经展示出令人印象深刻的规划能力。然而,尽管最近取得了一些进展,但是获得既可行(基于可承受性),又具有成本效益(在计划长度上)的计划仍然是一个挑战。这与利用领域知识(在PDDL等行动模型中形式化)和启发式搜索生成可行最优计划的启发式规划方法形成对比。受到此启发,我们提出了通过利用LLM的世界知识和启发式搜索原理来结合LLM和启发式规划的方法。我们的方法SayCanPay利用LLM生成行动(Say),并由可学习的领域知识评估行动的可行性(Can)和长期奖励/回报(Pay),然后通过启发式搜索选择最佳的行动序列。我们的贡献是:(1)在启发式规划的背景下创新的LLM规划问题表述;(2)将根据可行性和成本效益的要素整合到生成的计划中;(3)使用启发式搜索来搜索行动。我们进行了广泛的评估,结果显示我们的模型超过了其他LLM规划方法。

作者:Rishi Hazra, Pedro Zuidberg Dos Martires, Luc De Raedt

论文ID:2308.12682

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-25

PDF 下载: 英文版 中文版pdf翻译中