走向社会可解释人工智能的建模和验证

摘要:社会可解释人工智能(SAI)是人工智能领域的一个新方向,强调分散化、透明度、社会背景和人类用户的关注。SAI研究尚处于早期阶段。因此,它着重于提供预期功能,但很大程度上忽略了由于恶意或错误活动可能导致的不受欢迎的行为。我们提出,在为了涵盖相关方面的广度时,可以使用多智能体系统中开发的战略能力模型和逻辑。利用STV模型检查器,我们迈出了正式建模和验证SAI环境的第一步,特别是验证它们对受损AI模块的各种攻击的抵抗力。

作者:Damian Kurpiewski, Wojciech Jamroga, Teofil Sidoruk

论文ID:2302.01063

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2023-02-03

PDF 下载: 英文版 中文版pdf翻译中