1、谢富纪 2009年4月,1,第六章 完全但不完美信息动态博弈,现实生活中对于信息的掌握并不总是那么充分和对称,人们购买商品时可能缺乏对商品内在质量的或生产过程的了解,企业人事经理雇佣员工时很难了解应聘者的真实素质,保险公司销售人寿保险时则常苦于缺乏投保人健康情况的关键信息。信息不充分和不对称通常会使人们判断和决策难度增加,对决策、博弈的结果和效率产生很大的影响。因此需要对信息不充分、不对称情况下博弈问题进行研究。,谢富纪 2009年4月,2,1. 不完美信息动态博弈,完全信息:所有博弈方对博弈中的各种情况下的得益都完全了解。完美信息:完全了解自己行为之前的博弈过程的博弈方。完美信息动态博弈:如
2、果一个动态博弈中的所有博弈方都是有完美信息的,我们称这种博弈为“完美信息的动态博弈” 。其中的博弈方我们称为“有完美信息的博弈方”。不完美信息动态博弈:博弈中没有关于博弈进程完美信息的动态博弈。其中的博弈方我们称为“有不完美信息的博弈方”。,谢富纪 2009年4月,3,1. 不完美信息动态博弈,本章讨论的不完美信息动态博弈中,各博弈方对博弈结束时每个博弈方的得益是完全清楚的,因此博弈方是有“完全信息”的,这类博弈我们称为“完全但不完美信息动态博弈”,或简称“不完美信息动态博弈”。不完美信息动态博弈的本质特征是博弈方之间的信息是不对称的。,谢富纪 2009年4月,4,例如:二手车的交易。先是车主
3、选择如何使用车子,有好、差两种方式。第二阶段,原车主作为卖方决定是否要卖,价格可以有一种,也可以有多种,最后买方决定是否买下。假设买方不讨价还价,只是接受价格或是拒绝。买方作为博弈方对第一阶段的卖方的行为不了解,因此具有不完美信息。将两个节点放在某博弈方同一个信息集中的方法,正是反映该博弈方的信息不完美性的合理方法。,1. 不完美信息动态博弈,谢富纪 2009年4月,5,好天气(75) 坏天气(25)(7000) (10000)(16000)(10000)运输路线扩展形,0,1,1. 不完美信息动态博弈,谢富纪 2009年4月,6,好 差卖 不卖 卖 不卖买 不买 买 不买(a),1,1,1,
4、2,1. 不完美信息动态博弈,谢富纪 2009年4月,7,买卖 不卖不买 好买 差卖 不卖不买(b)二手车交易扩展形,2,1,1,1,1. 不完美信息动态博弈,谢富纪 2009年4月,8,好 差卖 不卖 卖 不卖(0,0) (0,0)买 不买 买 不买(2,1)(0,0)(1,1)(1,0) 二手车交易(数值例子),1,1,1,2,1. 不完美信息动态博弈,谢富纪 2009年4月,9,子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分。1. 原博弈不是自身的一个子博弈。2.包含所有在初始节点之后的选择节点
5、和终点,但不 包含不跟在此初始节点之后的节点。3.不分割任何的信息集。,1. 不完美信息动态博弈,谢富纪 2009年4月,10,L RL R L RL R L R多节点信息集和子博弈(1),1,2,2,3,1. 不完美信息动态博弈,谢富纪 2009年4月,11,L RL R L RL R L R多节点信息集和子博弈(2),1,2,2,3,1. 不完美信息动态博弈,谢富纪 2009年4月,12,在完全且完美信息动态博弈中,通过要求均衡策略组合满足子博弈完美性(即策略组合在每个子博弈中都构成一个纳什均衡)来保证均衡策略中没有任何不可信的威胁或承诺,其核心均衡概念就是子博弈完美纳什均衡。在完全但不完
6、美信息的动态博弈中,因为存在多节点信息集,一些重要的选择及其后续阶段不构成子博弈,因此要求满足子博弈完美性就无法完全排除不可信的威胁或承诺,无法保证均衡策略中所有选择的可信性,为此必须发展新的均衡观念,新的均衡观念必须满足以下要求:,2. 完美贝叶斯均衡,谢富纪 2009年4月,13,1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1”。,2. 完美贝叶斯均衡,谢富纪 2009年4月,14,2:给定各博弈方的“判断”,他们
7、的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划。,2. 完美贝叶斯均衡,谢富纪 2009年4月,15,3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定。4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。当一个策略组合及相应的判断满足这样四个要求时,称为一个“完美贝叶斯均衡”。这是因为,其中序列理性与子博弈完美纳什均
8、衡中的子博弈完美性相似,要求3和4规定判断必须符合贝叶斯法则。,2. 完美贝叶斯均衡,谢富纪 2009年4月,16,所以,子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例。要求1实际上是解决完全但不完美信息动态博弈的基本前提,要有一个判断,否则决策就会失去依据。要求2序列理性相当于子博弈完美纳什均衡中的子博弈完美性。而在多节点信息集开始的不构成子博弈的部分中,序列理性通过要求各方遵循最大利益原则而排除博弈方策略中不可信的威胁或承诺。序列理性要求对保证完美贝叶斯均衡的真正稳定性是很重要的。,2. 完美贝叶斯均衡,谢富纪 2009年4月,17,R (1,3)L(p) M(1p)U
9、 D U D(2,1) (0,0) (0,0) (0,1)完全但不完美信息动态博弈,1,2,2. 完美贝叶斯均衡,首先说明条件1和条件2的必要性,谢富纪 2009年4月,18,条件1的必要性:如果博弈方2在轮到选择时(博弈方在第1阶段没有选R),对博弈方1选L还是选M的可能性大小毫无判断,则他将不知道选U和选D哪个更合理,也就是说,对两条路径的判断是决策的必要基础,从而也使均衡策略的基础。,2. 完美贝叶斯均衡,谢富纪 2009年4月,19,条件2的必要性:如果不要求序列理性,则博弈方2有一个可为自己争取到的收益3,即博弈方2威胁在轮到自己选择时唯一地选D,这样策略组合:博弈方1:第一阶段选R
10、;博弈方2:如果轮到自己选择,唯一选D。是一个纳什均衡,也是一个子博弈完美纳什均衡(因为该博弈没有子博弈)。但博弈方2的上述策略在博弈方1不选R时选L的概率较大时,明显包含一个不可信的威胁。因此要求2对于保证不完美信息动态博弈的均衡策略中没有不可信的威胁或者承诺具有关键作用。,2. 完美贝叶斯均衡,谢富纪 2009年4月,20,博弈方2在博弈方1第一阶段没有选R的情况下,判断博弈方1选L的概率p大于选M的概率1-p时,博弈方2选U。这时博弈方1在第一阶段应该选L。因此,策略组合:博弈方1:第一阶段选L;博弈方2:在轮到选择时,选U,且判断博弈方1选L、M的概率为(p,1-p)(p1-p)。构成
11、一个满足序列理性的策略组合。,2. 完美贝叶斯均衡,谢富纪 2009年4月,21,再分析要求3和要求4。均衡路径和非均衡路径:在完全与完美信息动态博弈中,在均衡路径上的信息集如果按均衡策略进行,则信息集一定会达到。在不完美信息动态博弈中,由于至少对某一博弈方的一个阶段来说,博弈实际达到何处是无法看到的,因此即使按均衡策略进行博弈,某信息集是否一定会达到也不确定。在均衡路径上,指如果博弈按均衡策略进行,则该信息集会以正的概率达到。,2. 完美贝叶斯均衡,谢富纪 2009年4月,22,策略组合:博弈方1第一阶段选L;博弈方2 第二阶段选U。要求3:博弈方2的判断是直接针对博弈方1的上期选择的。贝叶
12、斯法则自动满足(不存在条件概率问题)。要考虑博弈方2对博弈方1的上期选择的判断符合博弈方的均衡策略,也就是要符合博弈方1第一阶段的选择和博弈方2第二阶段的选择。(1) P=1的判断是双方策略均衡稳定的基础(符合双方 的利益);(2) p=0.75,对博弈方2选择U 有不良影响。(3) p=0.25,(L,U)就不再是均衡。这说明,在不完美信息博弈中,判断和均衡策略之间的相互依存关系,只有两者是一致的、协调的,才能是真正的均衡。,2. 完美贝叶斯均衡,谢富纪 2009年4月,23,要求4:不存在不在均衡路径上的需要判断的信息集。该要求自动满足。策略组合:博弈方1第一阶段选R,博弈方2第二阶段选D
13、。 此时博弈方2的两节点信息集就不在均衡路径上。贝叶斯法则自然满足,只讨论博弈方2判断与双方在此处可能有的均衡策略的一致性。 如果万一博弈方1在第一阶段偏离了R,博弈方2判断 (1)p=1,不符合要求4,因与自己的均衡策略D不符合。 (2)P=0,与自己的D符合,但不符合博弈方1选择。 实际上该博弈不存在与上述均衡策略组合相符合的不在均衡路径上的博弈方判断。说明该策略组合不可能是该博弈具有真正稳定性的完美贝叶斯均衡。,2. 完美贝叶斯均衡,谢富纪 2009年4月,24,判断形成的进一步解释:二手车交易模型。 (1)在卖方决定卖以后,买方需要判断车况是好还是坏的 概率P(g|s), P(b|s)
14、.P(g), P(b)可根据经验性知识或平均情况得到.只要知道卖方在车子好差两种情况下选择卖或者不卖 的概率,就可以计算出P(g|s), P(b|s).,P(b|s)=1- P(g|s),2. 完美贝叶斯均衡,谢富纪 2009年4月,25,好 差卖 不卖 卖 不卖(0,0) (0,0)买 不买 买 不买(2,1)(0,0)(1,1)(1,0) 二手车交易(数值例子),1,1,1,2,2. 完美贝叶斯均衡,谢富纪 2009年4月,26,车况好时,卖方肯定会卖. P(s|g)=1. 车况差时,卖方选择卖还是不卖,要取决于买方选择买的概率大小,若假设买方买车的概率是0.5,则卖方选择卖的期望得益与不
15、卖的得益都为0,因此, 买方判断P(s|b)=0.5(即认为卖方市风险中性的)是理性的。 再假设市场上总体来说车况好与差的概率都是0.5。 根据贝叶斯公式,有,2. 完美贝叶斯均衡,谢富纪 2009年4月,27,P(b|s)=1- P(g|s)=1-2/3=1/3.这个判断就满足要求3。,2. 完美贝叶斯均衡,谢富纪 2009年4月,28,F B( 2,0,0)L(p) R(1-p)U D U D(1,2,1)(3,3,3)(0,1,2)(0,1,1)三方三阶段不完全信息动态博弈,1,2,3,2. 完美贝叶斯均衡,谢富纪 2009年4月,29,设博弈方3判断博弈方2选L和R的概率为p和1-p.
16、 当p1/3时,选D。再看博弈方2,必然选L。可见,当p1/3时,符合博弈方2的策略,但严格地说,完全符合博弈方2均衡的博弈方3的判断是p=1。博弈方1选F。 均衡策略组合(F,L,D)以及博弈方3的判断p=1是一个完美贝叶斯均衡。,2. 完美贝叶斯均衡,谢富纪 2009年4月,30,进一步考察策略组合(B,L,U)及博弈方3的判断p=0 这是一个纳什均衡。 在判断p=0时,(B,L,U)是序列理性的。 并且均衡路径上没有需要判断的信息集,要求3满足。 此时博弈方3的信息集不在均衡路径上,但博弈方3的判断显然与博弈方2的策略L不符合。因此,上述策略组合和判断不能构成完美贝叶斯均衡。,2. 完美
17、贝叶斯均衡,谢富纪 2009年4月,31,这就排除了(B,L,U)完美贝叶斯均衡的范畴,使完美贝叶斯均衡更稳定。 因此,4个要求是判断(检验)完全但不完美信息动态博弈中,各博弈方的策略组合和相应的判断是否具有真正的稳定性的关键标准。 要求1-2体现了完美贝叶斯均衡的本质特征,要求3-4特别体现了在这种均衡中“判断”的重要性,“判断”与策略的同等重要性。,2. 完美贝叶斯均衡,谢富纪 2009年4月,32,3.单一价格二手车模型,好 差卖 不卖 卖 不卖(0,0) (0,0)买 不买 买 不买(P,V-P)(0,0)(P-C,W-P)(-C,0) 单一价格二手车交易,1,1,1,2,谢富纪 20
18、09年4月,33,当PC,VpW 时,由于二手车交易有许多可能的结果,我们至少应有一些标准,判断哪些结果是理想的,哪些结果是比较好的,为此将市场交易博弈问题化成以下四种类型。,3.单一价格二手车模型,谢富纪 2009年4月,34,市场类型:我们根据效率差异将市场均衡分为下面四个类型。1:市场完全失败。如果市场上所有的卖方,甚至质量“好”的商品的卖方,都因为担心卖不出去而不敢将商品投放市场,当然市场就完全不能运作,如果此时潜在的贸易利益确实是存在的,则我们称这种情形为“市场完全失败”。2:市场完全成功。如果只有质量好的商品的卖方将商品投放市场,而质量差的商品的卖方不敢将商品投放市场。此时因为市场
19、上的商品都是好的,因此买方会买下市场上所有商品,实现最大的贸易利益,我们称这种情形为“市场完全成功”。,3.单一价格二手车模型,谢富纪 2009年4月,35,3:市场部分成功。如果所有卖方,包括有好商品的和有差商品的,都将商品投放市场,而买方也不管好坏商品都买进。这样的情况称为“市场部分成功”。因为在这种情况下能够进行交易,潜在的贸易利益能够实现,但同时也会存在部分“不良交易”,即买方买进差商品蒙受的损失。4:市场接近失败。如果所有好商品的卖方都将商品投放市场,而只有部分“差”商品的卖方将商品投放市场,同时买方不是买下市场上的全部商品,而是以一定的概率随机决定是否买进,即双方都采用混合策略。这
20、样的市场称为“市场接近失败”。这种市场的总体效率低于市场完全成功和市场部分成功,但比市场完全失败要强。,3.单一价格二手车模型,谢富纪 2009年4月,36,合并均衡(pooling equilibrium):不同情况(拥有商品类型不同)的完美信息博弈方采取相同行为的市场均衡,称为“合并均衡”。分开均衡(separating equilibrium):不同情况的完美信息博弈方采取完全不同行为的市场均衡,我们称为“分开均衡”。,3.单一价格二手车模型,谢富纪 2009年4月,37,市场部分成功的合并均衡 如果我们假设质量差的车出现的概率为pb很小,即买方相信还是好车占绝大多数,并且伪装车的费用C
21、相对价格P很小,则下列策略组合和判断构成一个市场部分成功的完美贝叶斯均衡:1. 卖方选择卖,不管车子好差。2. 买方选择买,只要卖方卖。3. 买方的判断是p(g|s)=pg, p(b|s)=pb。,3.单一价格二手车模型,谢富纪 2009年4月,38,市场完全成功的分开均衡我们设P C,也即将差车伪装成好车很费钱,而其他条件不变,则车况好的卖方仍会选择卖。这样,下列策略组合和判断构成一个完美贝叶斯均衡,而且是一个市场完全成功的分开均衡。1.卖方在车况好时选择卖,车况差时不卖。2.买方买进,只要卖方卖。3.买方的判断是p(g|s)=1 , p(b|s)=0。,3.单一价格二手车模型,谢富纪 20
22、09年4月,39,市场完全失败的合并均衡如果出现最悲观的情况,即买方根据以往的经验,判断当卖方选择卖时一定是车况差的,即p(g|s)=0 , p(b|s)=1,则下列策略组合和该判断一起构成一个最不理想的市场完全失败类型的完美贝叶斯均衡:1.卖方选择不卖; 2.买方选择不买3. p(g|s)=0 , p(b|s)=1。实际上在该策略组合下买方的信息集根本不会达到。,3.单一价格二手车模型,谢富纪 2009年4月,40,市场接近失败的条件根据市场接近失败类型均衡的根本特征,这种市场类型的完美贝叶斯均衡必须满足两个条件:第一是PC,即价格大于差车伪装费用,因为这样有差车的卖方才会有卖车的愿望;第二
23、是p(g|s)(V-P)+ p(b|s)(W-P)0 ,即如果买方买下所有卖方出售的车子,他的期望得益小于0,也即损失的风险大于得益的机会。要避免市场完全失败,只有混合策略才能提供出路。,3.单一价格二手车模型,谢富纪 2009年4月,41,3.单一价格二手车模型,好 差卖 不卖 卖 不卖(0,0) (0,0)买 不买 买 不买(2000,1000)(0,0)(1000,-2000)(-1000,0),1,1,1,2,V=3000 W=0 P=2000 C=1000 Pg=Pb=0.5,谢富纪 2009年4月,42,市场接近失败的混合策略均衡如果我们允许博弈方使用混合策略,则下述策略组合和判断
24、就构成一个市场接近失败,而不是市场完全失败类型的完美贝叶斯均衡:1.卖方在车况好时选卖,车况差时以0.5的概率随机选择卖和不卖;2.买方以0.5的概率随机选择买或不买;3.买方的判断为p(g|s)=2/3 , p(b|s)=1/3。这是一种不理想的结果,因为差车的卖方和所有买方参与市场的平均结果是得益为零。,3.单一价格二手车模型,谢富纪 2009年4月,43,pg(V-P)+ pb(W-P) 市场部分成功 市场完全成功0 P C市场接近失败 市场完全 或完全失败 成功单一价格二手车交易的解,3.单一价格二手车模型,谢富纪 2009年4月,44,4. 双价二手车交易,单一价格二手车市场的特征是
25、价格是固定的,买方无法从商品价格方面获得任何信息。现实中卖方常常根据商品质量和市场情况确定或改变价格,买方也可以据此进行判断。价格的不同和变化往往也能透露一些商品质量方面的信息。设卖方不仅在车况差时可以选择高价和低价,在车况好时同样也可以选择高价和低价。用Ph和Pl分别表示高价和低价;并设只有车况差而卖方又想卖高价时才需对车子进行伪装,其他假设同前。,谢富纪 2009年4月,45,好 差高价 低价 高价 低价买 不买 买 不买 买 不买 买 不买 (Ph,V-Ph)(0,0)(Ph-C,W-Ph) (-C,0) (Pl,V-Pl) (0,0) (Pl,W-Pl) (0,0) 双价二手车模型,1
26、,1,1,2,2,4. 双价二手车交易,谢富纪 2009年4月,46,设只有车况差时而卖方又想卖高价时,才需要对车子进行伪装。VW, PhPl, V- Ph W-Pl0 W - Ph 即高价买好车比用低价买差车合算,而用低价买差车还不至于亏本,但如果用高价买到一辆差车则要吃亏。,4. 双价二手车交易,谢富纪 2009年4月,47,模型的均衡当CPh 时,该博弈会实现最理想的市场完全成功的完美贝叶斯均衡。该完美贝叶斯均衡的双方策略组合和相应的判断如下:1.卖方在车况好时要高价,车况差时要低价;2.买方买下卖方出售的车子;3.买方的判断是p(g|h)=1 , p(b|h)0, p(g|l)=0 ,
27、 p(b|l)1 。其中四个条件概率依次为卖方要高价时车况好、要高价时车况差、要低价时车况好、要低价时车况差的条件概率。,4. 双价二手车交易,谢富纪 2009年4月,48,上述理想情况并不普遍,在C较小时,常常会导致较差的市场均衡,包括市场完全失败的情况。如C=0,即以次充好不需要成本的情况。如果再满足Pg (V - Ph )+Pb(W- Ph )0,即买方选择买的期望得益小于0,则买方必然选择不买。最后卖方只好全部退出市场。这种在信息不完美的情况下,劣质品赶走优质品,搞垮整个市场的机制,被称为“柠檬原理”。,4. 双价二手车交易,谢富纪 2009年4月,49,5.有退款保证的双价二手车交易
28、,只有市场完全成功是理想和有效率的,其他几种均衡都不理想,不利于社会、经济总体效率的提高和经济发展。方法: 从根本上消除信息的不完美性。如消费者对想要买的商品做更多的调查,这可理解成提高了伪装的成本C。 但实用性值得考虑。,谢富纪 2009年4月,50,实现较理想的市场均衡需两个关键条件:(1)拥有劣质商品的卖方将劣质商品伪装成优质商品的成本一定存在而且要高。(2)买方买商品的消费者剩余平均来说大于上当受骗蒙受的损失,即劣质品在市场上的比例不是太大。这两个因素中第一个是最关键的。,5.有退款保证的双价二手车交易,谢富纪 2009年4月,51,对C的理解:狭义:仅是伪装成本。广义的:理解成卖方的
29、全部代价,既包括交易之前的清洁、整修等,也包括事后被迫追究责任或索赔等要付出的代价。也可以通过诚实经营的厂商向消费者提供各种质量承诺,实行包退、包换、包赔等制度来实现同样的目的。加大对假冒伪劣行为的惩罚力度。根据“激励的悖论”,短期内可能抑制假冒伪劣,但长期来看,可能使政府部门松懈失职。这对我们制定相关政策具有重要启示。,5.有退款保证的双价二手车交易,谢富纪 2009年4月,52,如果在上面的二手车市场上出现了C=0的情况,这时无论车况好还是坏,卖方肯定都会要高价,因此市场不会出现完全成功类型的均衡,如果车况差的比例比较高,则市场很可能会完全失败或接近失败。如果再设定市场上有一种退款保证制度
30、,当买方高价买到差车时,要求卖方必须陪偿买方V-W的损失。,5.有退款保证的双价二手车交易,谢富纪 2009年4月,53,好 差高价 低价 高价 低价买 不买 买 不买 买 不买 买 不买 (Ph,V-Ph)(0,0)(Ph+W-V,V-Ph) (0,0) (Pl,V-Pl) (0,0) (Pl,W-Pl) (0,0) 有退款保证的双价二手车交易,1,1,1,2,2,5.有退款保证的双价二手车交易,谢富纪 2009年4月,54,如果Ph+W-V0或Ph+W-Vpl,即差车冒充好车卖出去以后遭索赔的结果是会亏损,或者还不如卖低价合算,那么这时候差车的卖方就不会选择以次充好试图非法获利,即使伪装的成本仍然为0。其他方面仍然与前面的二手车交易模型相同,则,5.有退款保证的双价二手车交易,谢富纪 2009年4月,55,下列策略组合和判断构成一个市场完全成功类型的完美贝叶斯均衡:1.卖方在车况好时卖高价,车况差时卖低价;2.买方在卖方要高价、要低价时都选择买;3.买方判断p(g|h)=1 , p(b|h)0, p(g|l) =0 , p(b|l)1 。上述策略组合和判断是一个完美贝叶斯均衡,并且是一个市场完全成功类型的合并均衡。,5.有退款保证的双价二手车交易,