全球旧事资料 分类
期刊网httpwwwqika
comc
谢林仔细考察了博弈者相互之间的信息沟通程度与博弈结果的相应关系,探讨“协同博弈”(coordi
atio
games)形成的条件。谢林对非零和模型的研究,表明最大化个人功利的企图并不像在零和博弈中那样等于最小化人的功利。
(二)重复性囚徒困境模型研究
如果重复囚徒困境将被精确地重复N次,已知N是一个常数,那么会产生另一个事实:纳什均衡就是每次都背叛。用归纳法证明:你也可以在最后的回合背叛,既然你的对手将没有机会惩罚你。因此,你们都将在最后的回合背叛。这时,你可以在倒数第二回合中背叛,既然最后一回无论你做什么,你的对手都将背叛。依此类推。为了达到合作的目的,对两个参与者来说未来必须是不确定的。给出一个数据模型。假设囚徒困境的策略矩阵如表1。
我们假设囚徒的支付是阶段博弈支付贴现之和,并假定贴现因子等于1。若双方均为非理性的,那么他们每阶段都会选择不坦白。在不完全信息情况下,假设囚徒1有两种类型,理性的和非理性的,概率分别为1p和p,假设囚徒2也有两种类型,理性的或非理性的,概率分别为1q和q,为了叙述方便,用C代表“坦白(背叛)”Co
fess,D代表“不坦白(合作)”De
y。
首先讨论博弈只重复两次的情况:在t1阶段,非理性一方会选择D。在t2阶段,理性囚徒选择C,而理性囚徒在t1阶段的选择将是非理性囚徒在t2阶段的选择,如表2。
如果选择XD,YD,
理性囚徒1的期望支付是:3q21q108q13;
理性囚徒2的期望支付是:3p21p108p13
所以囚徒1和囚徒2对应于X,Y的选择期望支付矩阵为
8q20≥17q22且12≥8q13由此得出:p≤18且q≤29再推得:
当q≤18时,XC;当q≥29时,XC。
同理可得:当p≤18时,YC;当p≥29时,YC,如表3。
就是说如果理性囚徒12认为囚徒21属于非理性的概率不大于18,他将在第一阶段选择坦白,如果不小于29,则选择不坦白。
其次讨论理性囚徒认为他的同伙属于非理性的概率在18和29之间时,他将如何选择。
f龙源期刊网httpwwwqika
comc
假设囚徒1和囚徒2都是风险中性者。
当理性囚徒一方认为另一方属于非理性的概率pq≥a时,他将在第一阶段选择不坦白。在每个囚徒都没有暴露自己是理性的还是非理性的之前,理性囚徒选择不坦白的概率为1a,选择坦白的概率为a。若满足:
a8q201a12≥a17q221a8q13则q≤(a1)8a。
令aa18a,则a014。
所以,当一名理性囚徒认为同伙属于非理性的概率q≥014时,他将r
好听全球资料 返回顶部