得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡就是(坦白,坦白)。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持不坦白,两人都只会被判刑3年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。
假设一方是非理性的,另一方是理性的,即博弈双方均不知道对方是不是理性的,非理性一方理解为讲义气重信誉的人或担心坦白会受到出狱后的报复,假设他只有一种策略,如果博弈是重复的,在第一阶段,他必然选择不坦白,在以后阶段他将选择同伙前一阶段的选择,即你不坦白我就不坦白,你坦白我就坦白。而另一方是理性的,他不管对方是否理性的,他都将选择坦白。所以这次博弈的均衡是不坦白,坦白。
假设双方均为非理性的,那么他们不管同伙如何选择,他们都将选择不坦白,则博弈的均衡是(不坦白,不坦白)。
重复博弈中的“囚徒困境”
重复博弈中的“囚徒困境”,是指相同的博弈者会不断重逢,即不断重复面对相似的囚徒困境的选择条件。重复为博弈产生了新的动力结构。在重复性囚徒困境下,理性博弈者将考虑,如果我拒绝合作,不断背叛,为了减少你的损失你也背叛。通过重复,博弈者可按对手以往选择而决定当前选择。背叛有可能遭到惩罚,合作有可能获得收益。
(一)重复性囚徒困境博弈的理论研究
在“重复性囚徒困境”研究方面,最有成就者当推罗伯特艾克斯罗德、泰勒、哈丁等人。在其《合作的进化》一书中,艾克斯罗德用实验证明,在重复博弈条件下,一次性囚徒困境下背叛的占优策略将会为有条件合作的占优策略所取代,换言之,在一次性囚徒困境中,选择不合作策略的博弈者,在“重复性囚徒困境”中,将会采取合作策略以最大化个人利益、即“有条件合作”策略将是重复性囚徒困境下博弈者的占优策略。
f龙源期刊网httpwwwqika
comc
艾克斯罗德的结论,肯定了纯由利己主义者组成的世界中,建立互惠合作关系的可能性。这一结论对于人类社会的意义在于,即使在缺少政府权威的人群中,人们合作或建立社会秩序也是可能的,因为合作本身符合当事人长远的、根本的利益。合作产生的条件就是:“人们重新相遇的机会足够大”,即“合作是基于互利互惠的基础;而且未来的影响十分重要,它足以保证目前的互利互惠关系的稳定”。
f龙源r