1、第二章 完全信息静态信息博弈-纳什均衡,一 占优战略均衡二 重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,一 占优战略均衡,完全信息静态博弈完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付函数等)完全了解静态:所有参与人同时选择行动且只选择一次。同时:只要每个参与人在选择自己的行动时不知道其他参与人的选择,就是同时行动博弈分析的目的是预测均衡结果,一 占优战略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-5大于-80大于-1,-5大于-80大于-1,一 占优战略均衡,占优战略:不论其他人选择什么战略,参与
2、人i的最优战略是唯一的,这样的最优战略称为“占优战略”(dominant strategy)。,一 占优战略均衡,占优战略均衡定义:在博弈的战略表达式中,如果对于所有的i,Si*是i的占优战略,下列战略组合称为占优战略均衡:,一 占优战略均衡,注意:如果所有人都有(严格)占优战略存在,那么占优战略均衡就是可以预测的唯一均衡。占优战略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,不要求理性是共同知识)。为什么?,一 占优战略均衡,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式
3、表述,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,大猪有无严格占优战略?,第二章 完全信息静态信息博弈-纳什均衡,一占优战略均衡二重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,二 重复剔除的占优均衡,重复剔除严格劣战略:思路:首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。,二 重复剔除的占优均衡,注意: 与占优战略均
4、衡中的占优战略和劣战略不同,这里的占优战略或劣战略可能只是相对于另一个特定战略而言。,二 重复剔除的占优均衡,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,“按”是大猪的占优战略,纳什均衡:大猪按,小猪等待,二 重复剔除的占优均衡,重复剔除的占优均衡 战略组合 称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的,我们就说该博弈是重复剔除占优可解。 注意:如果重复剔除后的战略组合不唯一,该博弈就不是重复剔除占优可解的。,二 重复剔除的占优均衡,M,列先生,行先生,U,D,L,R,行:没有占优战略列:M严格优于R剔除 R,行:U优于D列:无占优战略
5、剔除 D,M优于L,(U,M)是重复剔除的占优均衡,二 重复剔除的占优均衡,练习:在下列战略式表达中,找出重复剔除的占优均衡,C2,R1,R2,C1,C3,R3,二 重复剔除的占优均衡,注意:1、重复剔除的占优均衡结果与劣战略的剔除顺序是否有关取决于剔除的是否是严格劣战略。2、重复剔除的占优均衡要求每个参与人是理性的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有参与人知道所有参与人知道所有参与是理性的,二 重复剔除的占优均衡,C2,R1,R2,C1,C3,R3,剔除顺序:R3、C3、C2、R2,战略组合(R1,C1),故一般使用严格劣战略剔除,可以看到,(R1
6、,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。,剔除顺序:C2、R2、C1、R3,战略组合(R1,C3),举例:,二 重复剔除的占优均衡,尽管许多博弈中重复剔除的占优均衡是一个合理的预测,但并不总是如此,尤其是大概支付某些极端值的时候。,参与人B,参与人A,U,D,L,R,U是A的最优选择,但是,只要有1/1000的概率B选R,A就会选D,房地产开发中需求小情况,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,斗鸡博弈,退,B,A,进,退,进,独木桥,纳什均衡:A进,B退;A退,B进,对于
7、相当多的博弈,我们无法运用重复剔除劣战略的方法找出均衡解。为了找出这些博弈的均衡解,需要引入纳什均衡。,第二章 完全信息静态信息博弈-纳什均衡,一 占优战略均衡二 重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,三 纳什均衡,假设n个参与人在博弈之前达成一个协议,规定每一个参与人选择一个特定的战略,另 代表这个协议,在没有外在强制力的情况下,如果没有任何人有积极性破坏这个协议,则这个协议是自动实施的。这个协议就构成了一个纳什均衡。,三 纳什均衡,通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最
8、好的策略。即双方在给定的策略下不愿意调整自己的策略。,情侣博弈,芭蕾,女,男,足球,芭蕾,足球,纳什均衡:(足球,足球); (芭蕾,芭蕾),三 纳什均衡,寻找纳什均衡,C2,R1,R2,C1,C3,R3,参与人B,参与人A,(R3,C3)是纳什均衡,三 纳什均衡,C2,R1,R2,C1,C3,R3,剔除顺序:R3、C3、C2、R2,战略组合(R1,C1),故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。,剔除顺序:C2、R2、C1、R3,战略组合(R1,C3),请用上述划线法寻找下列纳什均衡,猎鹿博弈,有两个打猎人,他们可以合作去猎鹿也可以单
9、独去猎兔,如果合作猎鹿,那么两个都可以分得4个单位的支付;如果一个人去猎鹿而另一个人去猎兔,那么前者支付为0(因为猎鹿需要两个人合作可以成功)后者的支付为2;如果两个人不合作都去猎兔,那么他们都可以得到3单位的支付。,猎兔,猎人乙,猎人甲,猎鹿,猎兔,猎鹿,显然该博弈有两个纯策略严格纳什均衡即要么两个合作猎鹿,要么两人去猎兔与一个混合策略纳什均衡。按Harsayi and Selten(1988)的定义,纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是风险占优纳什均衡。猎兔策略是一个保险策略,而猎鹿博弈则是一个帕累托效率策略但由于策略的不确定性而使它具有较大的风险,因此,均衡选择取决于参与人对风险的
10、态度。,选美博弈,选美比赛,为了吸引观众参与,设立大奖,凡献花投票投中最后冠军者,可抽大奖。甲、乙、丙三位美女一路过关斩将,冲入决赛。按照决赛规则,经过泳装、活力装、晚礼服展示和即兴演讲等环节后,由100名观众献花投票,获得鲜花最多者即获冠军。 假设100名观众中,心仪甲、乙、丙三位美女的分别为50、30、20人,按说,甲美女最后得到50朵鲜花,以高票夺冠应该没有悬念。但是,真正投票时,不少心仪甲、乙两美女的观众则犹豫了,因为,此前丙美女放出话来:喜欢她的观众可多了,多半人表示要投她的票,她肯定夺冠,所以要想抽大奖,就赶快给她献花(当然,她这一番话纯属忽悠)。而这时,心仪甲、乙两美女的部分观众
11、就想,如果我不选丙,而大多人都选了丙,我岂不是把大奖扔了,算了,看在大奖的份上,忍痛割爱吧,就投丙吧。你这样想,他也这样想,投票结果:甲30、乙20、丙50。金灿灿的皇冠就这样戴在了丙美女的头上,她满含热泪,弯腰鞠躬,感谢观众的厚爱.,支付占优与风险占优一致的协调博弈,Y,X,Y,X,此类博弈有两个严格纳什均衡(X1,X1);(X2,X2),其中第二个均衡既是风险占优又是支付占优均衡,并且博弈双方有完全一样的偏好。,左行右行博弈,两个在一条路上相对而行的行人,如果都向左或者都向右那么他们就不会相碰,因此,都获得支付1个单位.但如果两个中一个向左前方,一个向右前方那么他们就可能相碰,走起来不方便
12、。这种情况博弈双方有完全相同的偏好,协调博弈中两个严格纳什均衡是无差异的,而该博弈的两个严格纳什均衡就是无差异的。,右,行人乙,行人甲,左,右,左,练习:找出下列两对夫妻的纳什均衡,死了,恩爱夫妻,活着,死了,活着,死了,妻子,相互仇恨夫妻,活着,死了,活着,妻子,丈夫,丈夫,三 纳什均衡,一群赌徒在赌钱,每个人将钱放在自己身边(每个人都知道自己的钱有多少),忽然吹来一阵风将所有的钱都混在一起,使他们无法分辨哪些钱是自己的,纳什均衡为他们解决这个问题。,三 纳什均衡,纳什均衡与占优战略均衡及重复剔除的占优均衡:(1)每一个占优战略均衡及重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是
13、占优战略均衡或重复剔除的占优均衡;(2)纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合,但没有被剔除掉的组合不一定是纳什均衡,除非它是唯一的(不适用于严格弱劣战略的情况),案例5-市场进入阻挠,斗争,在位者,进入者,进入,不进入,默许,纳什均衡:进入,默许;不进入,斗争,三 纳什均衡,用重复剔除弱劣战略的方法找均衡,第二章 完全信息静态信息博弈-纳什均衡,一 占优战略均衡二 重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,四 混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,没有一个战略组合构成纳什均
14、衡,四 混合战略纳什均衡,反面,正面,反面,正面,猜谜游戏两个儿童各拿一枚硬币,若同时正面朝上或朝下,A给B 1分钱,若只有一面朝上,B给A 1分钱。,零和博弈博弈参与者有输有赢,但结果永远是0。,没有一个战略组合构成纳什均衡,四 混合战略纳什均衡,警察与小偷,银行,酒馆,警察,小偷,2万元,1万元,东边,西边,警察与小偷的最优策略各是什么?,四 混合战略纳什均衡,上述博弈的特征是:在这类博弈中,都不存在纯纳什均衡。参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。这种博弈的类型是什么?如何找到均衡?,
15、四 混合战略纳什均衡,请举一些这样的例子:,石头、剪子、布游戏老虎、杠子、鸡、虫子游戏扑克游戏橄榄球赛战争中,西边,东边,西边,东边,四 混合战略纳什均衡,警察抽签决定去银行还是酒馆,2/3的机会去银行,1/3的机会去酒馆;同样,小偷也抽签决定去银行还是酒馆, 2/3的机会去酒馆, 1/3的机会去银行。,四 混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。流浪汉:寻找工作的期望效用:1/22+1/2 1=1.5 流浪的期望效用: 1/23+1/2 0=1.5因此,流浪汉的任何一种战略都是都是对政府混合战略的最优反应
16、,四 混合战略纳什均衡,反面,正面,反面,正面,猜谜游戏两个小孩的最优策略是采取每个策略的可能性均为1/2;每个小孩各取策略的1/2是纳什均衡。,零和博弈,四 混合战略纳什均衡,战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。纯战略:如果一个战略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该战略为 纯战略。混合战略:如果一个战略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行 动,则该战略为混合战略。,四 混合战略纳什均衡,四 混合战略纳什均衡,纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略
17、si的概率为1,选其他纯战略的概率为0。,等待,小猪,大猪,按,等待,按,反面,正面,反面,正面,四 混合战略纳什均衡,如何寻找混合战略纳什均衡?支付最大化法支付等值法由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略)在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合。,四 混合战略纳什均衡,流浪,流浪汉,政府,救济,不救济,寻找工作,即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡,同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。?,支付最大化法,四 混合战略纳什均衡,社会福利
18、博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略,四 混合战略纳什均衡,假定最优混合战略存在,给定流浪汉选择混合战略(r,1- r),政府选择纯战略救济的期望效用为: 3r+(-1)(1-r)=4r-1选择纯战略不救济的效用为:-1r+0(1-r)=-r如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。 4r-1=-r r=0.2,流浪,流浪汉,政府,救济,不救济,寻找工作,支付等值法,四 混合战略
19、纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略,四 混合战略纳什均衡,对 的解释:如果流浪汉去找工作的概率小于0.2, 则政府选择不救济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.对 *= 0.5的解释如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.,四 混合战略纳什均衡,混合战略纳什均衡的含义:纳什均衡要求每个
20、参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中, , *=0.5是唯一的混合战略纳什均衡。从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。,四 混合战略纳什均衡,反面,正面,反面,正面,用上述方法:求该猜谜游戏的混合战略纳什均衡,四 混合战略纳什均衡,练习:模型化下述划拳博弈:两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果
21、一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯战略均衡吗?计算其混合战略纳什均衡。,第二章 完全信息静态信息博弈-纳什均衡,一 占优战略均衡二 重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,五 纳什均衡存在性及相关讨论,不同均衡概念的关系,占优均衡DSE,重复剔除占优均衡IEDE,纯战略纳什均衡PNE,混合战略纳什均衡MNE,五 纳什均衡存在性及相关讨论,纳什均衡存在性定理:每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)。,五 纳什均衡存在性及相关讨论,一个博弈可能有多个均衡:两
22、个人分蛋糕;性别战中的博弈;纳什均衡的多重性:博弈论并没有一个一般的理论证明纳什均衡结果一定能出现,芭蕾,女,男,足球,芭蕾,足球,五 纳什均衡存在性及相关讨论,如何保证均衡出现:1、“聚点”均衡(托马斯谢林(Thomas C. Schelling) :参与人可以使用某些被博弈模型抽象掉的信息达到一个“聚点均衡”。两个人分蛋糕;性别战中的博弈;两人同时给对方打电话,你和其他参与人均从下面一组数中选择一个数字,并画上圈:7,100,13,261,99,666 。如果你们的选择相同则赢利越多。你会选择哪个数呢?,想一想,五 纳什均衡存在性及相关讨论,2、廉价磋商-“协调博弈”尽管无法保证磋商会达成
23、一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。,一般,用户,供应商,先进,一般,先进,一般,用户,供应商,先进,一般,先进,聚点,五 纳什均衡存在性及相关讨论,3、相关均衡如果博弈的参与人可以根据某个共同观测到的信号选择行动,那么就可能出现相关均衡。,停车,行人,穿越,等待,行驶,司机,五 纳什均衡存在性及相关讨论,4、公平观念公平观念有时也可作为推测最可能的纳什均衡的工具。许多实验经济学的研究发现,经济行为中的确存在公平法则。,最后通牒实验,两个参与人分一笔钱,比如说1元钱,甲提分配方案,乙选择接受或拒绝。若乙接受,则实施甲的分配方案;若乙拒绝
24、,则实验者收回这笔钱。,五 纳什均衡存在性及相关讨论,5、学习过程 假定博弈重复多次,即使参与人最初难以协调行动,在博弈若干次后,某种特定的协调模式可能会形成,特别地,假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略,博弈可能收敛于一个纳什均衡。,第二章 完全信息静态信息博弈-纳什均衡,一 占优战略均衡二 重复剔除的占优均衡三 纳什均衡四 混合战略纳什均衡五 纳什均衡存在性及相关讨论六 纳什均衡应用举例,六 纳什均衡应用举例,诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。,六 纳什均衡应用举例,案例1 美苏争霸案例2 古巴导弹危机案例3 诺曼底登陆,