人工通用智能的一个标准:基于假设-演绎推理的测试,以ChatGPT为例

摘要:AI的关键推理能力,比如GPT-4,要想成为“思考机器”(AGI),就应该掌握推理-演绎推理。问题解决或问题回答一般可以理解为包含两个步骤:假设某个假设集合T适用于手头的问题或问题,并从T中演绎出解决方案或答案 - 因此称之为假设-演绎推理。假设-演绎推理的一个基本代理是因果推理。我们提出了简单的测试来检测这两种推理方式,并将其应用于ChatGPT。我们的研究表明,就当前而言,这个聊天机器人对于任一种推理方式的能力是有限的,一旦考虑的问题稍微复杂。然而,我们认为,如果一个AI能够在足够广泛的环境中进行这种类型的推理,那么它将成为一个AGI。

作者:Louis Vervoort, Vitaliy Mizyakov, Anastasia Ugleva

论文ID:2308.02950

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-08

PDF 下载: 英文版 中文版pdf翻译中