收藏 分享(赏)

第28章 博弈论1.ppt

上传人:wspkg9802 文档编号:8699090 上传时间:2019-07-08 格式:PPT 页数:77 大小:602KB
下载 相关 举报
第28章  博弈论1.ppt_第1页
第1页 / 共77页
第28章  博弈论1.ppt_第2页
第2页 / 共77页
第28章  博弈论1.ppt_第3页
第3页 / 共77页
第28章  博弈论1.ppt_第4页
第4页 / 共77页
第28章  博弈论1.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

1、第二十八章 博弈论初步,Game Theory,博弈论,博弈论是对策略互动进行一般分析的理论。 博弈论的英文名称为game theory,是研究决策主体的行为发生直接相互作用的失衡的决策以及这种决策的均衡问题的。,博弈论的应用,经济学:市场往往是不完全的,参与者的行为相互影响,因此,个人决策时必须考虑到对方的反应 寡头垄断 卡特尔 外部性 军事和政治策略,1994年,诺贝尔经济学奖授予三位博弈论专家:纳什、泽尔滕和海萨尼。 纳什,50年代研究非合作博弈 泽尔滕,60年代研究动态博弈,提出“精炼纳什均衡”概念 海萨尼,60年代末将不完全信息引入博弈论的研究。,一次博弈包含哪些组成部分?,一些参与

2、者(players) 每一个参与者的可能策略 (strategies) 每个参与者的每一种可能的策略选择的收益(payoffs),双人博弈,只有两个参与者 两个参与者,两种策略,四种收益组合,双人博弈举例,参与者 A 和 BA有两种策略“上”或“下”B的两种策略为“左”或“右” 表格中显示的是给参与者带来的四种可能的策略组合的收益,即博弈的收益矩阵(payoff matrix)。,收益矩阵,B,A,收益组合中第一项是A的收益,第二项是B的收益。,例如A选择 Up ,B 选择 Right ,那么A的收益是1,B的收益是8。,B,A,L,R,U,D,(3,9),(0,0),(1,8),(2,1),

3、收益矩阵,Player B,Player A,L,R,U,D,(3,9),(0,0),(1,8),(2,1),收益矩阵,而当A选择 Down B 选择 Right ,那么A的收益是2,B的收益是1。,Player B,Player A,一次博弈对应一个策略组合例如(U,R),在此 第一个元素是参与者A选择的策略,第二个 元素是参与者B选择的策略。,博弈的可能结果是什么呢?,Player B,Player A,Player B,Player A,如果B选择Right,那么A的最优反应是选择Down。 因为这将使得A的收益从1增加到2。 因此(U,R)不是可能的博弈结果。,(U,R) 是可能的 博

4、弈结果吗?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,如果B选择Right,A的最优反应就是选择Down。 如果A 选择Down,B的最优选择就是Right。 因此(D,R) 是可能的博弈结果。,(D,R)是可能的 博弈结果吗?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,如果A选择 Down,B的最优选择是Right, 因此(D,L)不是可能的博弈结果。,(D,L)是可能的 博弈结果吗?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Playe

5、r A,如果 A选择 Up 那么B的最优反应是Left。 如果 B选择 Left 那么A的最优反应是Up。 因此(U,L)是可能的博弈结果。,(U,L) 是可能 的博弈结果吗?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),纳什均衡,如果存在一个策略组合,其中每一个参与者的选择都是他的最优选择,此时的策略组合就是一个纳什均衡 (Nash equilibrium)组合。 我们的例子中有两个纳什均衡策略组合 (U,L)和(D,R)。,例子,Player B,Player A,(U,L) 、 (D,R)都是博弈的纳什均衡策略。 但是哪一个才是最终的解呢? 注意:对于参与双方而言(U

6、,L) 优于(D,R)。那么(U,L)是否是唯一的均衡解呢?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),囚徒困境 The Prisoners Dilemma,我们可以考虑著名的囚徒困境模型来检验最可能的博弈结果是否一定是帕累托有效的结果。,可能的博弈结果如何?,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,-10),S,C,S,C,如果Bonnie选择沉默,Clyde的最优反应是坦白。 如果Bonnie选择坦白,Clyde的最优反应还是坦白。,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,

7、-10),S,C,S,C,无论Bonnie采取何种行动,Clyde的最优选择都是坦白。 因此,坦白是Clyde的占优策略(dominant strategy) 。,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,-10),S,C,S,C,同样的,无论Clyde采取那种行动,Bonnie 的最优反应都是坦白。坦白也是Bonnie的占 优策略(dominant strategy) 。,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,-10),S,C,S,C,唯一的纳什均衡组合是(C,C),尽管对于 双方而言(S,S)能

8、够带来更多的收益。 所以,唯一的纳什均衡解不是最优解。,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,-10),S,C,S,C,谁先选择?,在前面的两个例子中,参与者都是同时采取行动的。 这种博弈称为同时博弈 (simultaneous play games).,但是某些博弈是某个参与者首先采取行动,其他参与者后采取行动。 这类博弈称为序贯博弈(sequential play games)。 首先行动的参与者是领导者,第二个行动的参与者是跟随者。,序贯博弈举例,有时博弈不止一个纳什均衡结果,此时很难看出哪一种结果可能发生。 此时如果博弈行动有先后,那么

9、我们就有可能判断出哪一种结果更可能出现。,Player B,Player A,当同时行动时,(U,L) 、(D,R) 都是纳什均衡 的策略组合,我们无法判断哪一种组合结果 出现的可能性更大。,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,假如此时博弈行为是有先后的,例如A先行动, B跟随其后行动,那么我们可以用扩展形式 (extensive form)(广延型博弈)重新描述博弈。,L,R,U,D,(3,9),(0,0),(1,8),(2,1),广延型博弈举例:完美信息,U,D,L,L,R,R,(3,9),(1,8),(0,0),(2,1),

10、A,B,B,A 先行动。 B 后行动。,U,D,L,L,R,R,(3,9),(1,8),(0,0),(2,1),A,B,B,当A选U时,B一定选L, (U,L) 是一个纳什均衡策略。,首先观察B的决策,广延型博弈解法:反向归纳法,U,D,L,L,R,R,(3,9),(1,8),(0,0),(2,1),A,B,B,(U,L) 是一个纳什均衡策略组合。 (D,R) 也是一个纳什均衡策略组合。 哪一个是可能的结果?,首先观察B的决策,U,D,L,L,R,R,(3,9),(1,8),(0,0),(2,1),A,B,B,如果A 选择U,B选择L; A得到3。 如果A 选择D,B选择R; A得到2。,然后

11、观察A的决策,U,D,L,L,R,R,(3,9),(1,8),(0,0),(2,1),A,B,B,因此 (U,L)是可能的纳什均衡结果。,如果A 选择U,B选择L; A得到3。 如果A 选择D,B选择R; A得到2。,威胁,进入,不进入,斗争,不斗争,(0,0),(2,1),(1,9),(1,9),进入者,在位者,在位者,A 先行动。 B 后行动。,斗争,不斗争,策略(进入,不斗争)是合理的。 但此时原先的在位者只能得到1。 他该怎么办?,威胁,进入,不进入,斗争,不斗争,(0,0),(2,1),(1,9),(1,9),进入者,在位者,在位者,A 先行动。 B 后行动。,斗争,不斗争,威胁进入

12、者,只要你进入,我一定斗争。 但是,显然不是一个可信的威胁。,遏制进入的博弈:可信的威胁,进入,不进入,斗争,不斗争,(0,2),(2,1),(1,9),(1,9),进入者,在位者,在位者,A 先行动。 B 后行动。,斗争,不斗争,如果存在备用的生产能力,一旦使用, 可以降低生产成本,那么威胁变得可信。,纯策略(Pure Strategies),Player B,Player A,再次回到我们同时博弈的初始模型。此时存在 两个纳什均衡结果(U,L)和 (D,R)。,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,A要么选择U要么选择D,不能选

13、择两者的组合。 U 和D 是A的纯策略(pure strategies)。,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,同样的,L和R是B的纯策略。,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,因而, (U,L)和 (D,R)是纯策略的纳什均衡(pure strategy Nash equilibrium)。是否每种博弈必定存在至少一个纯策略的纳什均衡呢?,L,R,U,D,(3,9),(0,0),(1,8),(2,1),Player B,Player A,这个新的博弈模型是否存在纯策

14、略 的纳什均衡呢?,(1,2),(0,4),(0,5),(3,2),U,D,L,R,Player B,A,(U,L)是纳什均衡组合吗? 不是。 (U,R)是纳什均衡组合吗? 不是。 (D,L)是纳什均衡组合吗? 不是。 (D,R)是纳什均衡组合吗? 不是。,(1,2),(0,4),(0,5),(3,2),U,D,L,R,Player B,Player A,因此该博弈在纯策略中不存在纳什均衡结果。 尽管如此,如果是混合策略(mixed strategies) , 就会有纳什均衡结果了。,(1,2),(0,4),(0,5),(3,2),U,D,L,R,混合策略 Mixed Strategies,和

15、A要么选Up要么选Down不同,此时A可以在一种概率分布状态(pU,1-pU)下进行选择。意味着A可以以pU的概率选择Up,以及以 1-pU 的概率选择Down。 概率分布(pU,1-pU) 是A的混合策略。,同样的,B可以在一种概率分布状态(pL,1-pL)下进行选择。意味着B可以以pL的概率选择Left,以及以 1-pL 的概率选择Right。 概率分布(pL,1-pL) 是B的混合策略。,Player A,(1,2),(0,4),(0,5),(3,2),U,D,L,R,Player B,该纯策略博弈中不存在纳什均衡结果。但如果是混合 策略(mixed strategies),就会有纳什均

16、衡结果了。如何计算?,Player A,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,Player A,如果 B 选择Left,她的预期收益是,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,Player A,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,如果 B 选择Left,她的预期收益是如果B 选择Right,她的预期收益是,Player A,当 时, B 只可能选择 Left。但是B选L

17、eft不存在纳什均衡组合。,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,Player A,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,当 时, B 只可能选择Right。但是B选Right不存在纳什均衡组合。,Player A,因此无论B如何行动都不存在纳什均衡结果, B 在选Left和Right之间无差异;即,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,Player A,因此无论B如何

18、行动都不存在纳什均衡结果, B 在选Left和Right之间无差异;即,(1,2),(0,4),(0,5),(3,2),U,pU,D,1-pU,L,pL,R,1-pL,Player B,Player A,(1,2),(0,4),(0,5),(3,2),U,D,L,pL,R,1-pL,Player B,因此无论B如何行动都不存在纳什均衡结果, B 在选Left和Right之间无差异;即,Player A,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,Player A,如果A选择Up,他的预期收益是,(1,2),(0,4),(0,5),(3,2)

19、,L,pL,R,1-pL,U,D,Player B,Player A,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,如果A选择Up,他的预期收益是如果A选择Down,他的预期收益是,Player A,当, 时,A将只选择 Up。 但是,如果仅选up将不存在纳什均衡组合。,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,Player A,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,当, 时,A将只选择 Down。 但是,此时也不存在纳什均衡组

20、合。,Player A,因此,此时不存在纳什均衡组合,A对于选择Up 或者Down无差异,即,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,Player A,(1,2),(0,4),(0,5),(3,2),L,pL,R,1-pL,U,D,Player B,因此,此时不存在纳什均衡组合,A对于选择Up 或者Down无差异,即,Player A,(1,2),(0,4),(0,5),(3,2),L,R,U,D,Player B,因此,此时不存在纳什均衡组合,A对于选择Up 或者Down无差异,即,Player B,Player A,所以当A选择混合

21、策略(3/5, 2/5),B选择混合策略 (3/4, 1/4)时,该博弈存在纳什均衡结果。,(1,2),(0,4),(0,5),(3,2),U,D,L,R,Player B,Player A,获得收益组合(1,2)的概率是,(1,2),(0,4),(0,5),(3,2),U,D,L,R,9/20,Player B,Player A,获得收益组合 (0,4) 的概率是,(0,4),(0,5),(3,2),U,D,L,R,(1,2),9/20,3/20,Player B,Player A,获得收益组合(0,5)的概率是,(0,4),(0,5),U,D,L,R,(1,2),9/20,3/20,6/2

22、0,(3,2),Player B,Player A,获得收益组合(3,2)的概率是,(0,4),U,D,L,R,(1,2),9/20,3/20,(0,5),(3,2),6/20,2/20,Player B,Player A,(0,4),U,D,L,R,(1,2),9/20,3/20,(0,5),(3,2),6/20,2/20,Player B,Player A,A预期的纳什均衡收益为:,(0,4),U,D,L,R,(1,2),9/20,3/20,(0,5),(3,2),6/20,2/20,Player B,Player A,(0,4),U,D,L,R,(1,2),9/20,3/20,(0,5)

23、,(3,2),6/20,2/20,A预期的纳什均衡收益为:,B预期的纳什均衡收益为:,Q:既然在混合策略均衡时,参与者在不同的纯战略之间是无差异的,他为何还要以特定的概率选择不同的战略,而不是选择特定的纯战略呢? A:给对手造成不确定性,让对方不知道自己将会采取何种行动,期待对手做出有利于自己的行为。,存在多少纳什均衡?,拥有无数参与者,每一个都有无数的纯策略的博弈至少有一个纳什均衡结果。 因此,如果博弈没有纯策略的纳什均衡结果,那么它一定有至少一个混合策略的纳什均衡结果。,摆脱囚徒困境:重复博弈,冷酷策略: 开始选择抵赖 继续选择抵赖,直到对方选择坦白 一旦对方选择坦白,永远选择坦白,假设B

24、onnie选择了冷酷策略: 一旦Clyde选择坦白,那么此后Bonnie永远选择坦白。 Clyde选择坦白的收益记为:A=-1+(-10)+(-10) 2+ Clyde选择抵赖的收益记为:B=-5+(-5)+(-5) 2+其中是贴现因子,未来收益的现在价值。,Clyde,Bonnie,(-5,-5),(-30,-1),(-1,-30),(-10,-10),S,C,S,C,A=-1+(-10)+(-10) 2+=9-10/(1- ) B=-5+(-5)+(-5) 2+= -5/(1- ) 因此,只要AB,Clyde就会一直选择抵赖。 此时,只要9-10/(1- ) -5/(1- ), 即4/9,Clyde就会一直选择抵赖,从而走出囚徒困境。,结论:只要贴现因子足够大,那么未来收益大小现在就要充分考虑,从而将来不合作的威胁足以使得参与者选择帕累托有效的策略。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报