全球旧事资料 分类
龙源期刊网httpwwwqika
comc
囚徒困境从单次博弈到重复博弈
作者:杨懋祁守成来源:《商业时代》2009年第02期
中图分类号:F22432文献标识码:A
内容摘要:本文从博弈论中的经典案例“囚徒困境”入手,阐述了单次博弈与重复博弈中的囚徒困境现象。随后论证了囚徒困境在单次博弈与重复博弈中的均衡区别,说明了在重复博弈条件下合作产生的可能性。
关键词:囚徒困境单次博弈重复博弈合作
囚徒困境是博弈论中非零和博弈的代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中囚徒困境的例子屡见不鲜。
“囚徒困境”博弈是博弈论中的经典案例。这个故事讲的是两个嫌疑犯A和B,作案后被警察抓住,被分别关在不同的审讯室。警察为了得到所需的口供,告诉每个人:如果两人都不坦白,每人以妨碍公务罪各被判刑三年;如果两人都坦白,各判刑十年;如果两人中一人坦白、另一人不坦白,则坦白的人判刑两年、不坦白的人判刑十二年。在这个博弈中,每个嫌疑犯都有两种可选择的战略:坦白或不坦白。显然每个囚徒的最优战略都是坦白。这是因为假定A选择坦白的话、B最好也选择坦白,因B坦白判刑十年,而不坦白却要判刑十二年;假定A选择不坦白的话,B最好还是选择坦白,因为B坦白的话就判刑二年,而不坦白却要被判刑三年。即是说,不管A坦白或不坦白,B的最优选择都是坦白。反过来,同样地,不管B是坦白还是不坦白,A的最优选择也是坦白。结果,两个人都选择了坦白,各判刑十年。
单次博弈中的“囚徒困境”
经典的“囚徒困境”博弈单次博弈,反映了集体理性和个人理性的矛盾。假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
f龙源期刊网httpwwwqika
comc
假设二人均为理性的个人,且只追求自己个人利益,二人到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?由于隔绝监禁,信息不明,二人并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比不坦白要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方不坦白、不背叛会让我获释,所以会选择背叛;若对方背叛指控我,我也要指控对方才能r
好听全球资料 返回顶部