评估人工智能通用智能的人工开放世界:一个概念设计

摘要:如何评估人工通用智能(AGI)是一个长期以来被讨论但仍未解决的关键问题。在研究狭义人工智能领域中,这似乎不是一个严重的问题,因为该领域的研究人员专注于一些特定问题以及认知的某些方面,并且评估标准是明确定义的。相比之下,一个AGI代理应该解决的是既没有被两个代理人也没有被开发者遇到过的问题。然而,一旦开发者通过问题对代理人进行测试和调试,这个从未遇到的问题就变成了已经遇到过的问题,结果是这个问题在某种程度上被开发者解决了,利用了他们的经验而不是代理人的能力。我们称之为开发者经验的陷阱所导致的这种冲突可能导致这类问题很难成为被认可的标准。在本文中,我们提出了一种名为人工开放世界的评估方法,旨在跳出这个陷阱。直觉是实际世界中的大部分经验应该不需要应用到人工世界中,并且该世界在某种意义上应该是开放的,使得在测试之前开发者无法感知世界和解决问题,尽管之后他们被允许检查所有的数据。该世界以类似实际世界的方式生成,并提出了一般形式的问题。一个度量标准被提出来评估研究的进展。本文描述了人工开放世界的概念设计,但形式化和实现留待将来解决。

作者:Bowen Xu, Quansheng Ren

论文ID:2206.01044

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-25

PDF 下载: 英文版 中文版pdf翻译中