迭代囚徒困境中的反应性手段

摘要:对于理解配对相遇中的直接互惠和合作,迭代囚徒困境(IPD)是一个被广泛研究的框架。然而,评估各种IPD策略的道德性仍然存在很大的不足。在这里,我们通过提出一套合理的道德性指标来部分解决这个问题,以量化公正的四个方面。由于数学的可处理性和表达力,我们将闭合形式计算集中在反应策略类上。我们将反应手段定义为研究IPD和迭代雪堆游戏(ISG)中参与者在典型情况下的行为的工具。我们计算了四种函数的反应手段,以捕捉人类关于“善良”和“公平竞争”的直觉。其中两种函数与IPD和ISG的成功强烈负相关,而另外两种函数与成功弱相关。我们的结果将有助于使用简单直观的道德性指标评估和比较基于机器学习算法的强大IPD策略。

作者:Grant Molnar, Caroline Hammond, and Feng Fu

论文ID:2302.13909

分类:Physics and Society

分类简称:physics.soc-ph

提交时间:2023-02-28

PDF 下载: 英文版 中文版pdf翻译中