1、第四章 完全且完美信息动态博弈,本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。,完全且完美信息动态博弈的主要特点,(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都可以被观察到, (3)每个可能的行动组合下局中人的收益是共同知识。,第三章 完全且完美信息动态博弈,一 博弈扩展式表述
2、二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美纳什均衡 四、完全且完美信息的动态博弈的案例,一 博弈扩展式表述 (一)博弈的标准式(或战略式、正则式或策略式),不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,(二)博弈扩展式表述,博弈的扩展式表述包括四个要素: 参与人集合(Player) 每个参与人的战略集合(Strategy) 博弈的顺序(Order) 由战略组合决定的每个参与人的支付(Payoff),扩展式表示的一个例子,博弈树始于 局中人1 的一个决策结点,这时1要从L和R中作出选择,如果局中人1选择L,
3、其后就到达 局中人2 的一个决策结点,这时,局中人2要从L和R中作出选择。类似地,如果局中人1选择R,则将到达局中人2的另一个决策结点。这时局中人2从L和R中选择行动。无论局中人2选择了哪一个,都将到达终结点 (即博弈结束)且两局中人分别得到相应终点节下面的收益。,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件
4、的概率分布,房地产开发博弈,横向扩展式举例:,扩展型,为了让“树”描绘博弈,其结点和枝需要满足三条性质: 1单一的出发点。重要的是知道博弈从何处开始,所以必须有一个,也只能有一个出发点。 2 无循环。重要的是在博弈运行中,我们不要陷入僵局;树枝循原路折回并造成一个循环一定是不可接受的。 3 单方向前进。重要的是,对于博弈如何进行下去不能模棱两可,因此,必定不存在二个或多个枝导向同一个结。,为保证这三条性质,在前结点上强加下述限制:,1结点不能是自身的前结点。 2前结点的前结点也是前结点:如果结点是的前结点,依次结点是的前结点,那么也是的前结点。 3前结点可以排序:如果和都是的前结点,必定是或者
5、是的前结点,或者反过来。 4必定存在一个共同的前结点:考虑任意两个结,和,它们之间没有一个是另一个的前结点。那么,必定存在一个结点,它是和双方的前结点。,动态博弈的战略,动态博弈的战略的表述,战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。,在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。,足球,男,足球,芭蕾,女,女,芭蕾,足球,芭蕾,(2,1),(0,0),(1,2),(0,0),x,x,Battle of Sexes if Boy moves first,足球,男的策略:足球,芭蕾 选择足球;还是选
6、择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。,策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。,Battle of Sexes if Boy moves first,可以写成标准式(战略式),足球,足球,足球,芭蕾,芭蕾, 足球,芭蕾,足球,足球,芭蕾,wife,husband,
7、标准式(战略式),The strategy combinations.,( B, B, B ),?,在8个图里找纳什均衡,( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) (
8、-1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),Of 8 strategy combination, 3 are Nash,Three Nash equilibria of Battle of Sexes are:( B, B, B ), ( S, S, S ), and ( S, B, S ); Their corresponding outcomes are all:( Ballet, Ballet ), ( Soccer, Soccer ), and ( Soccer, Soccer ).,不同的纳什均衡可
9、以对应相同的结果,一个动态博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?,子博弈完美纳什均衡-不可置信威胁,美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具。 不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。 现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥
10、对弟弟的警告置之不理。的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。,二、子博弈精炼纳什均衡(或子博弈完
11、美纳什均衡),一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在每个子博弈中都构成纳什均衡,也就是说,组成完美纳什均衡的战略必须在每一个子博弈中都是最优的。 一个精炼纳什均衡首先必须是一个纳什均衡,但纳什均衡不一定是精炼纳什均衡。 承诺行动-当事人使自己的威胁战略变得可置信的行动。,子博弈完美纳什均衡,泽尔腾引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。什么是子博弈,什么是子博弈完美纳什均衡? 有没有更好的方法找到子博弈完美纳什均衡?,完全信息动态
12、博弈-子博弈完美纳什均衡 泽尔腾(1965),子博弈?,Think of a branch of a tree as a (smaller) tree. If a branch of a tree representing a gamedoes not divide any information set of the game, then it is a subgame of the game.,王 P175 什么是“支”?,不开发,房地产开发博弈,找出房地产开发博弈的子博弈,子博弈,动态博弈中的子博弈,虚线框出的部分正是博弈方2在博弈方1选择进时所面临的决策问题,它本身构成博弈方2的一个单
13、人博弈,我们称它为原先来后到博弈的一个“子博弈”。,Game and subgames(子博弈未标完),子博弈定义,由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成,它必须有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。,子博弈不好找! 学完后面的信息集请看P177,信息集,为了扩展式表述也可用来表述静态博弈,我们使用虚线圈。如:,情爱博弈的扩展式表述,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(
14、-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B在决策时不确切地知道自然的选择;B的决策结由4个变为2个,房地产开发博弈,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策),房地产开发博弈,Battle of Sexes again if Boy moves first,Boy,Girl,Ballet,Ballet,Ba
15、llet,Soccer,Soccer,Soccer,( 1, 2),( -1, -1),( 0, 0),( 2, 1),Represent Battle of Sexes as a simultaneous-move game with a tree,Information sets,Boy,Girl,Ballet,Ballet,Ballet,Soccer,Soccer,Soccer,( 1, 2),( -1, -1),( 0, 0),( 2, 1),结(nodes): 枝(branches): 信息集(information sets):,博弈树的结构,包括决策结和终点结。决策结是参与人采取
16、行动的时点;终点结是博弈行动路径的终点。,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。,一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结: (1)每一个决策结都是同一个参与人的决策结 (2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。,错误信息集示例见书166.,1、一个信息集罩住的首先必须是同一个局中人的决策节点。 2、一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。 3、,3、Same-set-same-strategies principle: At any decis
17、ion node belonging toa specific information set, the player has same strategies/actions to choose.Thus, no games like this:,2.1 博弈的扩展式表述,如果博弈树的所有信息集都是单结的,则称为“完美信息博弈”,没有任何两个决策结是用虚线连起来的 自然信息集总是假设为单结的 博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序 有了信息集的概念,扩展式表述也可用来表述静态博弈,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),子博弈:是原博弈的一部分,它本身也
18、可以作为一个独立的博弈进行分析:(1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)。(2)子博弈的信息集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。习惯上,任何博弈的本身称为自身的一个子博弈。,书上的定义175: 1)S的博弈树是T的博弈树的一支(什么是支?见175); 2)博弈S不能分割博弈T的信息集,具体说,质押博弈T的某个信息集的任何一个决策节点是博弈S的一个决策节点,那么T的
19、这个信息集的每一个决策节点都必须是博弈S的决策节点。 3) ,P177 图表514,A,开发,不开发,X,X,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),子博弈完美纳什均衡:扩展式博弈的战略组合是一个子博弈完美纳什均衡,如果:(1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。
20、,( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),Restricted to the circled subgames, the Nash are unstable. Thus there is only one subgame-perfect equilibrium.,A,开发,不开发,B,B,开发,不开发,开发,(1,0),(0,1),(0,0),(-3,-3),x,x,房地产开发博弈,(不开发,(开发,开发),
21、(开发,(不开发,开发),(开发,(不开发,不开发) 在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),不开发,判断下列均衡结果哪个构成子博弈完美纳什均衡?,不开发,b,c,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的;而构成子博弈完美纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也
22、是最优的。这是纳什均衡与子博弈完美纳什均衡的实质区别。,( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ),Restricted to the circled subgames, the Nash are unstable. Thus there is only one subgame-perfect equilibrium.,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),战略是参与人行动规则的完备描述,它要
23、告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈完美纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),练习: 参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两
24、人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述: (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策); (2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞; (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策; (4),同(3),但妻子先决策,丈夫后决策.,三、用逆向归纳法求-子博弈完美纳什均衡,微软公司的入门考试题,强盗分赃(向前展望,倒后推理) 有5个强盗抢得100枚金币,在如何分赃上争论不休,于是他们决定: (1)抽签决定个人
25、的号码(1,2,3,4,5) (2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就通过,否则他被扔进大海喂鲨鱼; (3)1号死后,2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号被扔进大海; (4)依次类推,知道找到一个每个人都接受的方案(当然,如果只剩5号,他独吞) 结果会如何?,三、用逆向归纳法求-子博弈完美纳什均衡,1,U,D,L,(3,1),(0,0),2,2,2,R,三、用逆向归纳法求-子博弈完美纳什均衡,1,U,D,L,(3,1),(0,0),2,2,2,R,给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈
26、的纳什均衡倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。,如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),1,U,D,L,(1,1),2,2,0,R,U,(3,0),(0,2),1,D,子博弈完美纳什均衡(U,U),L).U和L分别是参与人1和参与人2在非均衡路径上的选择。逆向归纳法求解子博弈完美纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈
27、的劣战略,最后生存下来的战略构成完美纳什均衡。,完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965),用逆向归纳法求解的子博弈完美纳什均衡也要求“所有的参与人是理性的”是共同知识。如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。,1,D,(1,1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。,多个参与人的情况,(2,2),逆向归纳法与子搏弈完美纳什均衡的存在问题,逆向
28、归纳法与子搏弈完美纳什均衡的存在问题,如果n很大,结果又如何呢?,1,D,(1,1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,多个参与人的情况,(2,2),对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。这个链越长,共同知识的要求就越难满足。,逆向归纳法与子搏弈完美纳什均衡
29、的存在问题,1,D,(1,1),A?,2,D,(0,3),A,1,D,(98,98),A,2,D,(98,101),A,另一种蜈蚣博弈,(100,100),2,D,(97,100),A,1,D,(99,99),A,有两个参与人1、2,若第一次1决策结束,1、2都得n,若2决策结束,1得n-1,B得n+2,下一轮从1、1都是n+1开始,共100次,每个参与人有100个决策结。,1,D,(2,2),A,2,D,(1,4),A,但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于你的参与人未来的行为。特别是,你如何修正你对参与人理性程度的评价。,轮流出价的讨价还价模型
30、,分蛋糕的动态博弈 游戏规则:第一轮由第一个参与人(小鹃)提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮;小明提出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮;蛋糕融化呈线性,游戏结束,蛋糕融化 问:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?,轮流出价的讨价还价模型,第一种情况:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?,博弈的结果是:假如“轮数”是偶数,双方各得一半,假若轮数是奇数,则小鹃得
31、到(n+1)/2n;小明得到(n-1)/(2n),四、完全且完美信息的动态博弈的案例,例1 斯塔克尔贝格双寡头竞争模型 例2 劳资博弈 例3 序贯谈判例4 制造商与销售商的博弈 例5 承包基数博弈,练习:已知条件和斯塔克尔贝一样,求按古诺模型博弈的结果。,P(Q)=a-Q,1 斯塔克尔贝里双头垄断模型,斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行。比如在美国汽车产业发展史中的某些阶段,通用汽车就扮演过这种领导者的角色(这一例子把模型直接扩展到允许不止一个追随企业,如福特、克莱斯勒等等)。根据斯塔克尔贝里的假定,模型中的企业选择
32、其产量,这一点和古诺模型是一致的(只不过古诺模型中企业是同时行动的,不同于这里的序贯行动)。,这里P(Q)=a-Q,是市场上的总产品Q=q1+q2时的市场出清价格,c是生产的边际成本,为一常数(固定成本为0)。为解出这一博弈的逆向归纳解,我们首先计算企业2对企业1任意产量的最优反应,R2(q1)应满足:,博弈的时间顺序如下:(1)企业1选择产量q1 0; (2)企业2观测到然后选择产量q2 0(3)企业1的收益由下面的利润函数给出:,P(Q),对上面的通过求极值可得:,已知q1 a-c,在前面我们分析同时行动的古诺博弈中,得出的R2(q1)和上式完全一致,两者的不同之处在于这里的R2(q1)是
33、企业2对企业1已观测到的产量的真实反应,而在古诺的分析中, R2(q1)是企业2对假定的企业1的产量的最优反应,且企业1的产量选择是和企业2同时作出的。,由于企业1也能够像企业2一样解出企业2的最优反应,企业1就可以预测到他如选择q1,企业2将根据R2(q1)选择产量。那么在博弈的第一阶段,企业1的问题就可表示为:,解得:,这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。 对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价:回顾在古诺博弈的纳什均衡中,每一企业的产量为(a一c)/3,也就是说,斯塔克尔贝里博弈中逆向归纳解的总产量3(a-c)/4,比古诺博弈中纳什均衡的总产量 2(a-c)/3要高,从而斯
34、塔克尔贝里博弈相应的市场出清价格就比较低。 不过在斯塔克尔贝里博弈中,企业1完全可以选择古诺均衡产量(a一c)/3 ,这时企业2的最优反应同样是古诺均衡的产量,也就是说在斯塔克尔贝里博弈中,企业1完全可以使利润水平达到古诺均衡的水平,而却选择了其他产量,,那么企业1在斯塔克尔贝里博弈中的利润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低了,从而总利润水平也会下降,那么和古诺博弈的结果相比,在斯塔克尔贝里博弈中,企业1利润的增加必定意味着企业2福利的恶化。和古诺博弈相比,斯塔克尔贝里博弈中企业2利润水平的降低,揭示了单人决策问题和多人决策间题的一个重要不同之处。在单人决策理
35、论中,占有更多的信息决不会对决策制定者带来不利,然而在博弈论中,了解更多的信息(或更为精确地说,是让其他参加者知道一个人掌握更多的信息)却可以让一个参与者受损。,斯塔科尔贝里博弈中信息进一步的探讨,在斯塔克尔贝里博弈中,存在问题的信息是企业的产量:企业2知道q1,并且(重要的是)企业1知道企业2知道q1。为看清楚这一信息的影响,我们把上面序贯行动的博弈稍作修改,假设企业1先选择q1 ,之后企业2选择q2,但事前并没有观测到q1,如果企业2确信企业1选择了它的斯塔克尔贝里产量(a-c)/2,则企业2的最优反应仍是R2 (q1)=(a-c)/4。 但是,如果企业1预测到企业2将持有这一推断并选择这
36、一产量,企业1就会倾向于它对,(a-c)/4的最优反应-即3(a-c)/8而不愿去选择斯塔克尔贝里产量(a-c)/2,那么企业2就不会相信企业1选择了斯塔克尔贝里产量。从而这一修改过的序贯行动博弈的惟一纳什均衡,对两个企业都是选择产量(a-c)/3.-这正是古诺博弈中的纳什均衡,其中企业是同时行动的。,2、里昂惕夫的工会模型,在里昂惕夫(1946)模型中,讨论了一个企业和一个垄断的工会组织(即作为企业劳动力惟一供给者的工会组织)的相互关系:工会对工资水平说一不二,但企业却可以自主决定就业人数(在更符合现实情况的模型中,企业和工会间就工资水平讨价还价,但企业仍自主决定就业,得到的定性结果与本模型
37、相似)。工会的效用函数为U(W, L),其中W为工会向企业开出的工资水平,L为就业人数。,假定U(W, L)是W和L的增函数。企业的利润函数为 ,其中R (L)为企业雇佣L名工人可以取得的收入(在最优的生产和产品市场决策下),假定R (L)是增函数,并且为凹函数。假定博弈的时序为:(1)工会给出需要的工资水平W;(2)企业观测到(并接受)W,随后选择雇佣人数L;(3)收益分别为U(W, L)和 。即使没有假定U(W, L)和R (L)的具体的表达式,从而无法明确解出该博弈的逆向归纳解,但我们仍可以就解的主要特征进行讨论。,首先,对工会在第一阶段任意一个工资水平w,我们能够分析在第二阶段企业最优
38、反应L*(W)的特征。给定w,企业选择L*(W)满足下式:,一阶条件为:,为了满足上述一阶条件,假设R(0)=; R()=0.,下面的图把L *(w)表示为w的函数(但坐标轴经过旋转以便于和以后的数据相比较),并表示出它和企业每条等利润线交于其最高点。若令L保持不变,,L保持不变,w降低时企业的利润就会提高,于是较低的等利润曲线代表了较高的利润水平。,这张图描述了工会的无差异曲线,若令L不变,当w提高时工会的福利就会增加。于是较高的无差异曲线代表了工会较高的效用水平。,下面我们分析工会在第一阶段的问题,由于工会和企业同样可以解出企业在第二阶段的问题,工会就可预测到如果它要求的工资水平为w1,企
39、业最优反应的就业人数将会是L*(w1)。那么,工会在第一阶段的问题可以表示为:,表现在图中的无差异曲线上就是,工会希望选择一个工资水平w,由此得到的结果(w, L*(w)处于可能达到的最高的无差异线上。这一最优化间题的解为w*,这样一个工资要求将使得工会通过(w*, L*(w*)的无差异曲线与L*(w)相切于该点,如图所示。从而(w*, L*(w*)就是这一工资与就业博弈的逆向归纳解。,更进一步我们还可以看出,(w*,L*(w*)是低效率的,在上图中,如果w和L处于图中阴影部分以内,企业和工会的效用水平都会提高。这种低效率对实践中企业对雇佣工人数量保持的绝对控制权提出了质疑。(允许工人和企业就
40、工资相互讨价还价,但企业仍对雇佣工人数量绝对控制,也会得到相似的低效率解)。,埃斯皮诺萨和里(Espi nosa&Rhee, 1989 )基于如下事实为这一质疑提供了一个解释:企业和工会之间经常会进行定期或不定期的重复谈判(在美国经常是每三年一次),在这样的重复博弈中,可能会存在一个均衡,使得工会的选择w和企业的选择L都在图所示的阴影部分以内,即使在每一次性谈判中,这样的w和L都不是逆向归纳解。,3、序贯谈判(讨价还价博弈),分析一个三阶谈判模型,接受 不接受,甲乙必须接受,讨价还价博弈,甲,出S1,乙,接受 不接受,出S2,甲,(S1, 1-S1),S2, (1-S2) 2S, 2(1-S)
41、,第一阶段 第二阶段 第三阶段,参与人1和2就一美元的分配进行谈判。他们轮流提出方案:首先参与人1提出一个分配建议,参与人2可以接受或拒绝;如果参与人2拒绝,就由参与人2提出分配建议,参与人1选择接受或拒绝;如此一直进行下去。一个条件一旦被拒绝,它就不再有任何约束力,并和博弈下面的进行不再相关。每一个条件都代表一个阶段,参与人都没有足够的耐心:他们对后面阶段得到的收益进行贴现,每一阶段的贴现因子为(1)在第一阶段开始时,参与人1建议他分走1美元的s1,留给参与人2的份额为1-s1。参与人2或者接受这一条件(这种情况下,博弈结束,参与人1的收益为s1 ,参与人2的收益为1-s1 ,都可立刻拿到)
42、;或者拒绝这一条件(这种情况下,博弈将继续进行,进入第二阶段)。,(2)在第二阶段的开始。参与人2提议参与人1分得1美元的s2,留给参与人2的份额为1-s2 ;参与人1或者接受条件(这种情况下,博弈结束,参与人1的收益s2,参与人2的收益1-s2都可立即拿到),或者拒绝这一条件,这种情况下,博弈继续进行,进入第三阶段。 (3)在第三阶段的开始,参与人1得到1美元的s,参与人2得到1-s。在这样的三阶段博弈中,第三阶段的解决方案(s, 1-s)是外生给定的。在我们后面将考虑的无限期模型中,第三阶段的收益、将表示如果博弈进行到第三阶段(即如果前面两个提议都被拒绝)的话,参与人1在其后进行的博弈中可
43、得到的收益。,为解出此三阶段博弈的逆向归纳解,首先需要计算如果博弈进行到第二阶段,参与人2可能提出的最优条件。参与人1拒绝参与人2在这一阶段的条件s2,可以在第三阶段得到s,只有在满足:,时参与人1才会接受条件s2。,再来看s2,2在第二阶段面临着在: (通过向参与人1提出条件,给他 ) 和 之间进行选择,很明显她将选择前者。也就是说,于是参与人2在第二阶段可以提出的最优条件是:,由于参与人1可以和参与人2同样地解出参与人2在第二阶段的决策问题,参与人1也就知道参与人2通过拒绝参与人1的条件,在第二阶段可以得到1-S2* ,但下一阶段得到的1-S2*在本阶段的价值只有 。那么,当且仅当 时,参与人2才会接受1-S1。从而参与人1在第一阶段的决策问题就可归于在本阶段收入 (通过向参与人2提出条件 )和下阶段收入S2之间作出选择。由于:,明显小于前者,所以参与人1在第一阶段提出的最优条件是S*1=,这样,在此三阶段博弈的逆向归纳解中,参与人1向参与人2提出分配方案(S*1,1-S*1),后者接受该方案。,完,