收藏 分享(赏)

博弈论第8次课——不完全信息动态博弈.ppt

上传人:天天快乐 文档编号:1101338 上传时间:2018-06-11 格式:PPT 页数:57 大小:589KB
下载 相关 举报
博弈论第8次课——不完全信息动态博弈.ppt_第1页
第1页 / 共57页
博弈论第8次课——不完全信息动态博弈.ppt_第2页
第2页 / 共57页
博弈论第8次课——不完全信息动态博弈.ppt_第3页
第3页 / 共57页
博弈论第8次课——不完全信息动态博弈.ppt_第4页
第4页 / 共57页
博弈论第8次课——不完全信息动态博弈.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、博弈论不完全信息动态博弈,博弈论与信息经济学,郝 海 天津工程师范学院经济管理,不完全信息动态博弈,精炼贝叶斯均衡 不完美信息博弈的精炼贝叶斯均衡 信号博弈,(一) 精炼贝叶斯均衡,不完全信息博弈“自然”选择参与人类型,参与人自己知道,其他参与人不知道;自然选择之后,参与人开始行动,行动有先后顺序,后行动者能观察到先行动者的行动,但不能观察到先行动者类型。(先行动者行动类型依存,每个参与人行动都传递着关于自己类型的某种信息)后行动者通过观察先行动者的行动来推断其类型或修正对其类型的先验信念(概率分布),然后选择自己的行动。,(一) 精炼贝叶斯均衡,先行动者预测自己的行动将被后行动者所利用,就会

2、设法传递对自己最有利的信息,避免传递对自己不利的信息。博弈过程不仅是选择行动的过程,也是参与人修正信念的过程。例,张三与李四的博弈张三恃强凌弱,第一次与李四见面,不知李四强弱。但对李四类型有先验概率0.8, 0.2张三通过观察李四吃辣椒的数量修正李四强弱的看法(后验概率),并以此确定对李四的态度,(一) 精炼贝叶斯均衡,李四预测到这一点,即使生性懦弱,也会强迫自己吃辣椒,以传达对自己有利的信息。两种结果:懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多,使得懦弱李四不敢模仿,张三能够区分李四类型并选择是否欺负李四。两类李四都吃同样多辣椒,张三不能从李四吃辣椒行为中推出自己的信息,维持对李四的类型的

3、先验信念0.8,0.2,市场进入博弈,博弈两个局中人,一个“在位者”,一个“进入者”。考虑t=1,2两个时期,在t=1,市场上有一个垄断企业( “在位者” )在生产,一个潜在的进入者是否进入;如果“进入者”进入,两个企业进行Cournot博弈,否则,“在位者”依然是一垄断者。,市场进入博弈,假设“在位者”有两种类型:高成本、低成本, “在位者”存在“私人信息”;进入者只知道“在位者”是高成本的概率为 ,低成本的概率为 。 这个概率是“公共知识”,是“进入者”对“在位者”类型的“先验信念”。同时假设“进入者”只有一个类型,进入成本为2,如果进入的话,生产成本与高成本的“在位者”成本相同。,市场进

4、入博弈,在t=1时,在“进入者”决定进入之前,“在位者”需要决定该时期的价格(或产量)。设有三种可能选择的价格p=4,5,6;如果是高成本的“在位者”,相应收益为u=2,6,7;如果是低成本的“在位者”,相应收益u=6,9,8。 在t=2时,若 “进入者”不进入,“在位者”仍是一个垄断者,利润如第一期t=1;若“进入者”进入,若“在位者” 高成本,各自收益为3,进入者的实际收益为1,若“在位者”低成本,收益分别为5,1,进入者的实际收益为1。,市场进入博弈,动态博弈,“进入者”可以观察到价格信号,修正自己的“先验信念”,得到“后验信念”,(2,0),(6,0),(7,0),(6,0),(9,0

5、),(8,0),完全信息条件下,若在位者高成本“进入”;若在位者低成本不进入,假设低成本在位者不会选择P=6,结果会怎样?,在位者的价格选择中包含关于其类型的信息,进入者可据此修正对在位者类型的先验信念在位者行动时必须考虑价格选择的信息效应,(一) 精炼贝叶斯均衡,1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格,进入者总是认为在位者高成本概率为*1/2 ,总是选择不进入;高成本在位者选择p=6,低成本在位者选择p=5。该均衡是否合理?均衡中包含不可置信的战略。一个合理均衡应满足如下要求:给定每个参与人有关其他参与人类型的后验信念,参与人的战略组合在每个后续博弈上构成贝叶斯均衡。后

6、验信念:参与人根据贝叶斯法则和均衡战略修正后验概率后续博弈:从每个信息集开始的博弈的剩余部分称为一个后续博弈。,(一) 精炼贝叶斯均衡,引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈精炼纳什均衡强化了纳什均衡是相同的。如果参与者的战略要成为博弈的一个精炼贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略要成为一个子博弈精炼纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。精炼贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什

7、均衡。,(二) 不完美信息博弈的精炼贝叶斯均衡,(0,0),(二) 不完美信息博弈的精炼贝叶斯均衡,1,L,M,2,U,B,R,该博弈存在两个纯战略NE:(M,U);(L,B),(M,U);(L,B)同样是子博弈 精炼纳什均衡,(L,B)却又明显要依赖于一个不可信的威胁:如果轮到参与者2行动,则选择 U优于选择B,1便不会由于2威胁他将在其后的行动中选择B,而去选择L,在信息完全但不完美的博弈中,尽管(L,B)是SPNE,它依赖一个不可信的空头威胁,应该从合理的预测中排除。,(二) 不完美信息博弈的精炼贝叶斯均衡,精炼贝叶斯均衡要求1:在每一信息集中,应该行动的参与者必须对博弈进行到该信息集中

8、的哪个节有一个推断。对于非单节信息集,推断是在信息集中不同节点的一个概率分布;对于单节的信息集,参与者的推断就是到达此单一决策节的概率为l。 要求2: 给定参与者的推断,参与者的战略必须满足序贯理性的要求。即在各个信息集,给定该信息集上概率分布和其他参与人的后续策略,参与人的行动必须是最优的。,(0,0),参与人2在自己信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。,给定该信念,2的行动必须是最优的(给定该信念,2的战略选择在后续博弈上构成贝叶斯均衡)。2选择U的期望支付为1*p+2*(1-p)=2-p2选择B的期望支付为0*p+1*(1-p)=1-p0.

9、6)均衡路径与非均衡路径均衡路径:各个局中人选择实施的行为所构成的路径非均衡路径:各个局中人没有选择实施的行为所构成的路径不但要给出均衡路径上的行为选择和信念,而且要给出非均衡路径上的行为选择和信念无论在均衡路径上还是在非均衡路径上,最优行为选择都是追求最大期望效用,信念都要合理,(三) 信号博弈,信号博弈是一种特殊的不完全信息动态博弈信号模型已被十分广泛地应用于经济学领域。如,spence (1973)文凭信号模型通常描绘的是二个参与人之间的两阶段不完全信息动态博弈。先行动者类型不为后行动者知道,而他只知道先行动者类型的先验概率分布。后行动者试图从他所观察到的先行动者的行动中对其类型进行概率

10、判断(形成后验信念),并选择最优行动。先行动者预测到自己的行动中包含关于自己类型的信息,有动机告诉后行动者真实类型,或者试图欺骗后行动者。,(三) 信号博弈,先行动者可直接告诉后行动者自己类型,但后行动者不会相信。如果要让后行动者相信,必须做出一种努力(使自己付出成本),该成本是其他类型的先行动者不能模仿的称成本支付为一种信号。通过该信号,先行动者能够告诉后行动者自己的真实类型例,企业金融市场融资,但投资者对真实赢利能力不了解。 真正高赢利能力的企业可以通过向投资者支付较高的权益份额来区分自己和低赢利能力的企业,从而让投资者识别自己的真实类型而投资。 另一方面,低赢利能力企业对自己真实赢利能力

11、是清楚的,不敢模仿高赢利能力企业,只能承诺低权益份额,投资者不会投资。,(三) 信号博弈,行为传递的信息和信号机制萨摩亚岛居民的文身;波那佩岛的山药;孔雀开屏;蛙鸣信号:经济或其他活动中具有信息传递作用的行为信号机制:通过信号传递信息的过程信号发出方:通过行为传递信息的一方信号接收方:获得信息的一方二手车模型中昂贵的承诺,(三) 信号博弈,信号博弈一般化:它包含两个参与者:发送者(记为S)与接收者(记为R)。博弈的时间顺序如下:自然按照概率分布 为发送者S从一个可行类型空间中选取类型 ;发送者S观察到自己的类型后,从一个可行信号集 中选取一个发送信号;接收者R观察到信号 ,然后从可行行动集中

12、选择一个行动 ;双方获得各自支付 和 。,1,N首先以0.5,0.5选择1的类型T1,T2,1观察到自己类型后从信号集L, R中进行选择,2观察到1的信号,然后从A,B中选择行动。,(三) 信号博弈,(三) 信号博弈,分离均衡(separating equilibrium):不同类型的参与人发送不同信号,混同均衡(pooling equilibrium):不同类型的参与人发送相同信号,准分离均衡(semi-equilibrium):一些类型的发送者随机选择信号,另一些类型发送者选择特定信号,幻灯片,信号要求1 2在观察到任何信号之后,接收者必须对哪些类型可能会发送持有一个推断后验概率。,信号要

13、求2R 给定后验概率,接受者的行动选择应满足期望支付最大化序贯理性,信号要求2S:在给定接收者战略的条件下,发送者选择的信号必须使发送者的支付最大化。-序贯理性,信号要求3 后验概率根据贝叶斯法则和发送者的战略形成,h,f,混同均衡(L,L),T1、T2是否有积极性发送L?,h,f,对于假设存在混同均衡(L,L),成立的条件是2对于1发送L的信号的反应是选择A,对发送R的信号的反应是B2均衡策略为(A,B),一个精炼贝叶斯均衡的表达中既要写出参与人在信息集上的行动选择,也同时表明他在信息集上的信念,混同均衡(R,R),2对L的最优反应是A(无论p为多少),此时T1支付为1,T2支付为2,分离均

14、衡(L,R),分离均衡(R,L),进入威慑(Entry Deterrence)博弈,进入威慑博弈也可称为进入阻挠博弈,它说的是目前市场上只有一个垄断者(在位者),垄断利润为300。市场外有一个潜在竞争者(进入者)想进入该市场,但必须支付进入成本10。当进入者决定进入时,在位者可以选择合作(默许),也可以选择斗争(如降价等)以阻止进入者进入。在默许下,市场总收益为100,两家平分;在斗争下,市场利润为0。给定不同博弈规则(行动顺序、信息等方面的差异),博弈的均衡及结果是不同的,下面分若干种情况进行讨论。(参见张维迎和拉斯缪森的教材),进入威慑I,此时假定进入者和在位者同时决策,信息是完全的。那么

15、,纳什均衡是什么?,进入威慑II,假定:进入者和在位者同时决策,但与I不同的是,在位者可能是高效率的(低成本) ,也可能是低效的(高成本),在位者类型只有在位者自己清楚,进入者并不知道究竟属于哪种类型,这是一个不完全信息静态博弈。对于不完全信息静态博弈的均衡被称为贝叶斯纳什均衡。进入威慑II的贝叶斯纳什均衡是什么呢?,进入威慑II(续),高成本情况,低成本情况,进入威慑III,假定:进入者先行动,之后在位者再根据观察到的进入者的行动做出自己的选择;信息是完全的。此时的子博弈精练纳什均衡是什么?博弈的结果是什么?与进入威慑I相比,两者的差异说明什么问题?怎样解决这个问题?,进入威慑III(续),

16、进入威慑IV,假定:进入者有可能是一个高效率的强进入者,也可能是一个低效率的弱进入者。进入者类型进入者自己知道,但在位者并不知道。对在位者来说,如果与强进入者斗争,那么得到的收益为0;如果与弱进入者斗争,则可得到更多的收益,暂假设为X;X的取值在不同类型博弈中位于0和300之间。在进入威慑IV中假定X=1。在进入威慑V中假定X=60。在进入威慑VI中假定X=300.,进入威慑IV,(0,300),(40,50) (-10,X),进入 不进入,合作 斗争,弱进入者,(0,300),(40,50) (-10,0),进入 不进入,合作 斗争,强进入者,N,E2,E1,0.5,0.5,I2,I1,精练

17、贝叶斯均衡,精练贝叶斯均衡(perfect Baysian equilibrium)是一个策略组合s和一组信念,使得在博弈的每一个节点上都有:(1)给定其他参与人的信念和策略,博弈剩余部分的策略是纳什均衡策略。(2)给定博弈到目前为止的历史,参与人在每一个信息集上的信念都是理性的(这意味着参与人假设他们处于均衡路径上,只要有可能,参与人就根据观察到的行动通过贝叶斯法则来修正后验概率)。,进入威慑IV的均衡,此时,X=1,斗争永远无利可图。精练贝叶斯均衡为(混同均衡): 进入者:进入|弱进入者,进入|强进入者 在位者:合作 信念:P(强者|进入)=0.5;P(强者|不进入)=a0,1 对于此博弈

18、而言,在位者对于非均衡路径上的信念是不重要的;但在某些情况下,非均衡路径上的信念是很重要的。,进入威慑V的均衡,此时,X=60,某些时候选择斗争是有利可图的。一个合理均衡 进入者:不管强弱均进入;在位者:合作 信念:P(强者|进入)=0.5;P(强者|不进入)=a0,1一个不合理均衡 进入者:不管强弱均不进入;在位者:斗争 信念:P (强者|不进入)=0.5; P(强者|进入)=0.1,进入威慑VI的均衡,此时,X=300,在位者因为不了解信息而得益。均衡: 进入者:不管强弱,进入者都选择不进入 在位者:斗争 信念:P(强者|进入)=0.5(消极推测); P(强者|不进入)=0.5此时,即是有

19、可能收益为零在位者也会选择斗争,而对于进入者来说,其实很希望就斗争的成本问题与在位者沟通,但是在位者不会相信进入者,所以进入者不会进入市场,在位者也因为不了解信息而得到垄断利润。思考:此时不存在进入者选择进入的均衡,也不存在分离均衡,为什么?,进入威慑VII:连锁店悖论,某个连锁店在20个城市里都有分店,现在这个连锁店试图阻止竞争对手进入这20个市场,也就是进入威慑III会重复进行20次。在进入威慑III里,当进入者进入一个市场时,在位者不会选择斗争;但是,现在有20个市场,在位者可能会为了阻止竞争者进入其他19个市场而选择斗争,因而,现在的结果可能不同于只有一个市场时的均衡结果。那么,此时,

20、连锁店在20个市场都采取斗争策略是博弈的子博弈精练均衡(完美均衡)吗?,进入威慑VIII:垄断限价模型(1),现实中存在这样的现象:垄断企业规定的产品价格一般低于经济学定义的最优垄断价格(即边际收益等于边际成本时的价格)。对此的传统解释是:如果价格等于垄断价格,其他企业看到有利可图,就会进入;相反,如果价格低一些,其他企业看到进入无利可图,就不会进入。但这种解释的问题是:价格作为一种承诺是不可置信的,因为不论垄断者索取什么价格,一旦其他企业进入,垄断者就会改变价格,因此,靠低价格是不可能阻止进入的。,进入威慑VIII:垄断限价模型(2),米尔格罗姆和罗伯茨(Milgrom and Robert

21、s,1982)则提出了垄断限价模型加以解释。假定在位者有可能是高成本也可能是低成本,进入者不知道。在位者先行动制定价格P,进入者观察到在位者制定的价格后再行动。由于不同成本函数下的最优价格是不一样的,因此,价格本身就可能包含了在位者成本的一些信息。,进入威慑VIII:垄断限价模型(3),如果存在一个价格P*,只有低成本企业才有利可图,而高成本企业是不敢模仿这个价格的,那么,存在精练贝叶斯均衡: 低成本在位者选择P*,高成本企业选择一个较高的垄断价格;如果进入者观察到在位者选择了P*,就推断其为低成本,不进入;否则,就认为在位者是高成本,进入。关于垄断限价模型的正式分析请阅读张维迎P192 197。此时,价格起到了传递信号的作用,那么,在现实生活中,价格还传递了什么信号呢?在什么条件下信号是可信的?那么,第2部分非对称信息将专门研究这个问题,我们将介绍生产博弈、次品市场博弈、教育博弈等,请大家预习。小结:连续策略、精练贝叶斯均衡,劳动市场信号博弈,劳动力素质的信号机制,博弈论均衡概念的总结,四个基本均衡概念之间的关系 子博弈精炼纳什均衡纳什均衡 精炼贝叶斯均衡 贝叶斯纳什均衡 不完全信息静态博弈中,精炼贝叶斯均衡=贝叶斯纳什均衡完全信息动态博弈中,精炼贝叶斯均衡=子博弈精炼纳什均衡完全信息静态博弈中,精炼贝叶斯均衡=纳什均衡,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报