增强大型语言模型的推理能力:一种基于图的验证方法
摘要:大型语言模型(LLM)展示了令人印象深刻的推理能力,尤其是在复杂推理任务(如数学问题)中,当其在特定设计的提示下进行指导时。这些模型通常使用一种思维链方法解决任务,这不仅增强了它们的推理能力,还提供了有价值的洞察力,用于了解它们的问题解决过程。然而,LLMs的推理能力仍有很大的改进空间。一些研究表明,将LLM输出验证器集成可以提高推理准确性,而不需要额外的模型训练。在本文中,我们遵循这些研究,并引入了一种新颖的基于图的方法来进一步增强LLMs的推理能力。我们假设一个LLM生成的推理任务的多个解可以通过推理图表示,因为不同推理路径的中间步骤之间存在逻辑连接。因此,我们提出了推理图验证器(RGV)来分析和验证由LLMs生成的解。通过评估这些图,模型可以产生更准确和可靠的结果。我们的实验结果表明,我们基于图的验证方法不仅显著增强了LLMs的推理能力,而且在提高这些模型的推理性能方面还优于现有的验证器方法。
作者:Lang Cao
论文ID:2308.09267
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-08-22