在(嘈杂的)迭代囚徒困境中平衡合作性和适应性
摘要:IPD的冠军策略缺乏一些理想的属性,这些属性在锦标赛中没有得到很好的测试,但在其他情境中将很重要。我们希望我们的策略在高噪声水平下能与克隆概率高地合作,并且它能引发合作,即对它的最佳游戏应该是以很高的概率合作。我们通过在适当条件下从适应于对手的策略转回到宽恕tit-for-tat策略来保证这些属性,在锦标赛表现上只需付出适度的成本。
作者:Adrian Hutter
论文ID:2303.03519
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2023-03-08