在（嘈杂的）迭代囚徒困境中平衡合作性和适应性-arXiv论文预印本中文版

在（嘈杂的）迭代囚徒困境中平衡合作性和适应性

摘要：IPD的冠军策略缺乏一些理想的属性，这些属性在锦标赛中没有得到很好的测试，但在其他情境中将很重要。我们希望我们的策略在高噪声水平下能与克隆概率高地合作，并且它能引发合作，即对它的最佳游戏应该是以很高的概率合作。我们通过在适当条件下从适应于对手的策略转回到宽恕tit-for-tat策略来保证这些属性，在锦标赛表现上只需付出适度的成本。

作者：Adrian Hutter

论文ID：2303.03519

分类：Computer Science and Game Theory

分类简称：cs.GT

提交时间：2023-03-08

PDF 下载： 英文版中文版pdf翻译中