增强大型语言模型的推理能力：一种基于图的验证方法-arXiv论文预印本中文版

增强大型语言模型的推理能力：一种基于图的验证方法

摘要：大型语言模型（LLM）展示了令人印象深刻的推理能力，尤其是在复杂推理任务（如数学问题）中，当其在特定设计的提示下进行指导时。这些模型通常使用一种思维链方法解决任务，这不仅增强了它们的推理能力，还提供了有价值的洞察力，用于了解它们的问题解决过程。然而，LLMs的推理能力仍有很大的改进空间。一些研究表明，将LLM输出验证器集成可以提高推理准确性，而不需要额外的模型训练。在本文中，我们遵循这些研究，并引入了一种新颖的基于图的方法来进一步增强LLMs的推理能力。我们假设一个LLM生成的推理任务的多个解可以通过推理图表示，因为不同推理路径的中间步骤之间存在逻辑连接。因此，我们提出了推理图验证器（RGV）来分析和验证由LLMs生成的解。通过评估这些图，模型可以产生更准确和可靠的结果。我们的实验结果表明，我们基于图的验证方法不仅显著增强了LLMs的推理能力，而且在提高这些模型的推理性能方面还优于现有的验证器方法。

作者：Lang Cao

论文ID：2308.09267

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-08-22

PDF 下载： 英文版中文版pdf翻译中