收藏 分享(赏)

7-不完全信息动态博弈--博弈论.ppt

上传人:无敌 文档编号:306712 上传时间:2018-03-27 格式:PPT 页数:31 大小:162KB
下载 相关 举报
7-不完全信息动态博弈--博弈论.ppt_第1页
第1页 / 共31页
7-不完全信息动态博弈--博弈论.ppt_第2页
第2页 / 共31页
7-不完全信息动态博弈--博弈论.ppt_第3页
第3页 / 共31页
7-不完全信息动态博弈--博弈论.ppt_第4页
第4页 / 共31页
7-不完全信息动态博弈--博弈论.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、7 不完全信息动态博弈,不完全信息动态博弈的特点古玩交易中的讨价还价寡头市场的产量博弈求婚与彩礼类型与海萨尼转换,7 不完全信息动态博弈,例:市场进入博弈,市场进入问题,在位者有两种类型,高成本、低成本;上述博弈中,进入者只能根据先验概率来判断是否选择进入;现假定在位者先选择价格,进入者可以通过在位者的定价,来修正自己的判断,因为价格会暴露一些成本信息。,不完全信息动态博弈,博弈的三阶段,第一阶段:自然选择在位者的类型,类型空间高成本,低成本,概率分布m, 1-m为共同知识。第二阶段:在位者行动空间p=4,p=5,p=6,得益: U1(高成本)=2,6,7 U1(低成本)=6,9,8第三阶段:

2、进入者行动空间进入,不进入;若进入,必须支付进入成本2个单位,并且其生产成本与高成本在位者相同。,第三阶段,若进入者选择“进入”,两企业进行Cournot博弈,分两种情况:若在位者是高成本,此时两企业有相同的生产成本,均衡价格为p*=5;各获利3,但进入者扣除成本2,得1;在位者是低成本时,非对称的Cournot博弈,均衡价格为p*=4,在位者得5,而进入者得1,扣除进入成本2,得-1。若选择“不进入”,在位者在后期可以取得垄断利润,得7或9。,不完全信息动态博弈,怎样求解?,如果是前一问题,进入者进入与否完全依赖于他对在位者成本函数的判断,若在位者是高成本,进入者进入后得利1,若在位者是低成

3、本的,则进入者进入后得利-1,因此进入者“进入”的期望利润为:m*1+(1-m)*(-1)=2*m-1如果 2*m-10, m1/2, 则进入者选择进入。,贝叶斯Nash均衡,若m1/2,则如下战略组合是一个贝叶斯均衡:进入者:不管在位者选择什么价格,他总是认为在位者是高成本的概率为m 1/2,总选择不进入;在位者,高成本类型:p=6, 低成本类型:p=5, 这是单阶段最优垄断价格。该均衡没有考虑后验概率,不是理性行为,因而是不合理的。,对于不完全信息动态博弈,完美贝叶斯Nash均衡要求:每一个参与人的信息集上有一个概率分布;给定概率分布和其他参与人的选择,每个参与人的战略是最优的;概率分布是

4、使用贝叶斯法则从最优战略和观测到的的行动得到的。,在动态情况下,进入者可以根据在位者的价格选择来修正其先验概率。这当然也取决于他怎么“认为”,如果他认为,低成本的在位者不会选择价格p=6,则他观察到p=6,就会得到后验概率:对手是高成本的概率是1。但是,另一方面,在位者也会知道自己对价格的选择,会给进入者提供自己真实类型的信息。因此,即使是高成本的在位者也不会选择价格为6。如,可模仿低成本在位者选5。,完美贝叶斯Nash均衡,假定先验概率m1/2,可以验证如下战略组合构成完美贝叶斯Nash均衡:在位者:不论是高成本,还是低成本,都选择p=5;进入者:只有当观测到p=6时,选择“进入”,否则“不

5、进入”;其基于的判断是: p(H|6)=0 ,p(L|4)=1, p(H|5)1/2,不完全信息动态博弈,证明,1)给定进入者的战略和后验概率,看在位者的选择对高成本在位者若选择p=6, 进入者“进入”,此时在位者的支付:7+3=10;若选择p=5, 进入者“不进入”,此时在位者的支付:6+7=13;若选择p=4,进入者“不进入”,此时在位者的支付:2+7=9;可见高成本在位者的最佳选择是p=5.,证明,1)给定进入者的战略和判断,看在位者的选择对低成本在位者若选择p=6, 进入者“进入”,此时在位者的支付:8+5=13;若选择p=5,进入者“不进入”,此时在位者的支付:9+9=18;若选择p

6、=4,进入者“不进入”,此时在位者的支付:6+9=15;可见低成本在位者的最佳选择是p=5.,证明,2)给定在位者的行动和判断,看进入者的选择:看到p=5时, p(H|5)=m1/2,进入的期望得益为:m*(1)+(1-m)*(-1)=2m-10,最佳选择是“不进入”;如果看到p=4, p(L|4)=1,进入的期望得益为-1,选择“不进入”;如果看到p=6, p(H|6)=0 ,进入的期望得益为1,选择“进入”。,证明,3)判断的形成均衡路径上:当在位者不论是高成本还是低成本,都选择p=5时,进入者依据其“信念”:p(5|L)=1, p(5|H)=1(即使在位者是高成本也会模仿低成本)。得到后

7、验概率: m=p(H|5)=m1/2(即使进入者知道在位者有可能模仿,但无法得到贝叶斯修正)。 非均衡路径上: 由于在位者即使是高成本也会模仿低成本,因此高成本在p(6|H)=0 ,p(4|H)=0,得到判断p(H|6)=0 ,p(L|4)=1。,合并均衡 Pooling equilibrium,合并均衡先验概率m1/2,即使对低成本在位者,p=5已经不再是最佳的选择。,不完全信息动态博弈,完美贝叶斯Nash均衡,当先验概率m1/2,则如下战略组合是完美贝叶斯Nash均衡:在位者:低成本类型,p=4; 高成本类型, p=6;进入者:当观察到p=4,就“不进入”;否则进入; 基于判断:p(H|4

8、)=0,p(H|6)=1, p(H|5)1/2,证明,1)给定进入者的战略和后验概率,看在位者的选择对高成本在位者若选择p=6, 进入者“进入”,此时在位者的支付:7+3=10;若选择p=5,进入者“进入”,此时在位者的支付:6+3=9;若选择p=4,进入者“不进入”,此时在位者的支付:2+7=9;可见高成本在位者的最佳选择是p=6.,证明,1)给定进入者的战略和后验概率,看在位者的选择对低成本在位者若选择p=6, 进入者“进入”,此时在位者的支付:8+3=11;若选择p=5,进入者“进入”,此时在位者的支付:9+5=14;若选择p=4,进入者“不进入”,此时在位者的支付:6+9=15;可见低

9、成本在位者的最佳选择是p=4.,证明,2)给定在位者的选择和判断,看进入者的选择:当观察到p=4时,根据进入者的判断m=p(H|4)=0,进入的期望得益m*(1)+(1-m)*(-1)=-11/2,进入者的期望得益m*(1)+(1-m)*(-1)=1, 最佳选择是“进入”,证明,3)判断的形成均衡路径上,p(4|H)=0,m=p(H|4)=0 p(6|L)=0,m=p(H|6)=1非均衡路径上, m= p(H|5) 1/2同均衡策略是相容的。,分离均衡 Separating equilibrium,分开均衡此时,在单阶段低成本在位者的垄断最优价格为p=5,但无法将自己与低成本的在位者区分,进入

10、者将“进入”,因此,他用3个单位的现期利润换取下一阶段的4个利润。而高成本在位者单阶段垄断最优价格为p=6,之所以不选取p=4,是因为下阶段的4个利润不足以弥补现期损失5个单位。,思考,第一种情况下高成本在位者得益=13低成本在位者得益=18第二种情况下高成本在位者得益=10低成本在位者得益=15,为什么低成本在位者的得益会降低?,为什么高成本在位者的得益会降低?,信号博弈,两个参与人,参与人1的类型是私人信息,称为信号发送者;参与人2只有一个类型,称为信号接收者。博弈顺序如下: (1)自然首先选择参与人1的类型; (2)参与人1在观测到类型后选择发出信号; (3)参与人2观测到参与人1发出的

11、信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动; (4)得到各自的支付。,张三与李四的博弈,张三恃强凌弱,第一次与李四见面,不知李四是强是弱,但根据第一印象判定李四为弱者的概率是0.2,为强者的概率是0.8, 那么一开始张三不会冒然欺负李四。假定张三可以通过李四吃早餐时吃辣椒的数量来修正对李四的看法,假定强者喜欢吃辣椒,弱者不喜欢吃辣椒。如果李四知道不吃辣椒的后果,即使生性懦弱,不喜食辣椒,也会强迫自己吃一些辣椒,以示自己不是弱者,但是张三自然会仔细观察李四能吃多少辣椒。除非,李四吃得足够多,否则张三不会认为李四是强者。对李四而言,即使是强者也不愿意招惹是非,可能会吃足够多的辣椒,使得弱者是无法承受的。,张三与李四的博弈,最后的结果可能有两种情况:懦弱的李四不吃辣椒,而强悍的李四吃辣椒,且吃得足够多,张三通过李四吃辣椒的行动来判定李四的类型,然后选择是否欺负李四。懦弱的李四和强悍的李四都吃了同样多数量的辣椒,张三不能从李四的行动中推出任何新的信息,其先验概率分布仍然是0.2,0.8,所以不会欺负李四。前一种为“分离均衡”,后一种为“合并均衡”。,本章重点,进一步理解完美贝叶斯纳什均衡理解“信号”的作用,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报