关于迭代囚徒困境的一些获胜策略或者《好人先生》和科萨诺斯特拉
摘要:成功解决被加列入 2004 年和 2005 年罪犯囚徒竞赛的两类策略。其中一类是改进的乐观型 TitForTat 策略,名为 OmegaTitForTat,能够识别共同的行为模式,并从可修复的对策僵局中恢复出来,除此之外基本与 TitForTat 行为一致。另一类是由一组策略共同作战的,其中一个被称为教父策略的个体使用 OmegaTitForTat 策略对非成员进行策略,同时从其他组员,即职业杀手的行为中获利。职业杀手愿意接受教父的虐待,并尽可能地降低其他玩家的得分,从而进一步提高教父与其他参与者之间的绩效。在简化的囚徒囚徒困境框架中研究勾结行为,使我们能够将其与自然界和人类社会的许多共同特征进行类比,从而进一步拓展囚徒囚徒困境作为研究合作行为的隐喻的范围。我们进一步提供证据表明,未来的囚徒囚徒竞赛中,这种合作策略将不可避免地占主导地位,因为它们可以以任意微妙的方式伪装成非合作策略。此外,我们还表明,在理论意义上,识别秘密勾结策略的一般问题是无法解决的。
作者:Wolfgang Slany and Wolfgang Kienreich
论文ID:cs/0609017
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2007-05-23