在(嘈杂的)迭代囚徒困境中平衡合作性和适应性

摘要:IPD的冠军策略缺乏一些理想的属性,这些属性在锦标赛中没有得到很好的测试,但在其他情境中将很重要。我们希望我们的策略在高噪声水平下能与克隆概率高地合作,并且它能引发合作,即对它的最佳游戏应该是以很高的概率合作。我们通过在适当条件下从适应于对手的策略转回到宽恕tit-for-tat策略来保证这些属性,在锦标赛表现上只需付出适度的成本。

作者:Adrian Hutter

论文ID:2303.03519

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-03-08

PDF 下载: 英文版 中文版pdf翻译中