重复囚徒困境的游戏
其目的就是要研究在无限次数的对局游戏中人为什么要合作,人什么时候是合作的,什么时候又是不合作的,如何使别人与你合作。
一位美国科学院院士、著名的行为分析和国际关系专家罗伯符艾克斯罗德搞了一场关于“重复囚徒困境”的游戏,艾克斯罗德的游戏思路非常简单,任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色,他们把自己的策略编入到计算机程序中,然后他们的程序会被成双成对地融入到不同的组合,在分好组以后,参与者就开始玩“囚徒困境”的游戏。在游戏中,有两个对策者,他们可以有两个选择:合作或背叛,每个人都必须在不知道对方选择的情况下,做出自己的选择。
艾克斯罗德邀请了来自经济界,心理学,补会学、政治学和数学领域的14位专家参与这一游戏,每个参加者每一步都要写出个体选择合作或不合作的程序,这个程序在作选择时可以利用对局的历史情况来分析,从而决定自己的策略。游戏双方的选择,放在一起就产生了四种可能的结果,即:
1合作.合作;2合作,背叛;3背叛,合作;4背叛,背叛;在这个游戏中,如果双方选择合作,双方都能得到较好的结果,即“对双方合作的奖励”为3分,如果一个合作而另一方背叛,那么,背叛者因为占了便宜,所以得到“对背叛投机”的5分,而合作者因为被对方占了便宜,只能得到0分。如果双方都背叛,那么双方既没有得到利益,也没有失去什么,双方都得1分。我们设想甲、乙两个程序在一起博弈,就出现这样的结果:
f甲:合作3乙:合作3甲:合作0乙:背叛5甲:背叛(5)乙:合作(0)甲:背叛(1)乙:背叛(1)就这种情形来看,对双方最好的结果是选择合作,总体得6分,如果一方选择合作,一方选不合作,总体得5分,如果两个人都不合作,总体得2分。竞赛是循环进行的,即每一个参赛程序都与其他程序相遇。按照事先约定的竞赛规则,每一个参赛程序还要与自己对局,以及和一个随机程序对局,所谓随机程序是以相等的概率50随机选择合作或背叛;艾克斯罗德要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两对局,以找出什么样的策略得分最高。14个程序再加上一个“随机程序“彼此开始了第一轮游戏,让我们来分析一下这个重复囚徒困境的游戏,虽然对个体而言最大的利益是得5分,但是如果对局在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契是r