收藏 分享(赏)

博弈论讲义4.ppt

上传人:11xg27ws 文档编号:5428129 上传时间:2019-03-02 格式:PPT 页数:29 大小:428KB
下载 相关 举报
博弈论讲义4.ppt_第1页
第1页 / 共29页
博弈论讲义4.ppt_第2页
第2页 / 共29页
博弈论讲义4.ppt_第3页
第3页 / 共29页
博弈论讲义4.ppt_第4页
第4页 / 共29页
博弈论讲义4.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、1,第二章 完全信息静态信息博弈-纳什均衡,一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 纳什均衡应用举例 六 混合战略纳什均衡 七 纳什均衡存在性及相关讨论,2,六、混合战略纳什均衡,点名博弈,逃课,学生,老师,不点名,点名,上课,3,六、混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,4,六 混合战略纳什均衡,反面,正面,反面,正面,猜谜游戏 三毛、一休各拿一枚硬币 若同时正面或反面出现,三毛给一休 1元钱, 若一正面和一反面,一休给三毛 1元钱。,零和博弈 博弈参与者有输有赢,但结果永远是0。,5,六混合战略纳什均衡

2、,警察与小偷,银行,酒馆,警察,小偷,2万元,1万元,东边,西边,警察与小偷的最优策略各是什么?,6,六混合战略纳什均衡,上述博弈的特征是: 在这些博弈中,都不存在在前面我们所讲的那种纳什均衡。 每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。因此,每个人都不能选择特定的一个行为,必须随机地选择不同的行动。 随机选择行动的概率不是任意的,而是有讲究的。,7,六 混合战略纳什均衡,反面,正面,反面,正面,零和博弈,三毛,三毛,一休,正面,反面,8,六 混合战略纳什均衡,战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行

3、动方案”。纯战略:如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略为纯战略。混合战略:如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该战略为混合战略。,9,六 混合战略纳什均衡,混合战略:如果一个战略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动,则该战略为混合战略。,10,六 混合战略纳什均衡,纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略si的概率为1,选其他纯战略的概率为0。,等待,小猪,大猪,按,等待,按,反面,正面,反面,正面,11,六 混合战略纳什均衡,如何寻找混合战略纳什均衡? 支付最大化法 支付

4、等值法 由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。 最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略) 在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合。,12,六 混合战略纳什均衡求解:支付最大化法,流浪,流浪汉,政府,救济,不救济,寻找工作,即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡,同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。?,支付最大化法,13,六 混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率

5、:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略,14,六 混合战略纳什均衡求解:支付等值法,假定最优混合战略存在,给定流浪汉选择混合战略(r,1- r),政府选择纯战略救济的期望效用为:3r+(-1)(1-r)=4r-1 选择纯战略不救济的效用为:-1r+0(1-r)=-r 如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。4r-1=-r r=0.2,流浪,流浪汉,政府,救济,不救济,寻找工作,支付等值法,流浪,15,六 混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:

6、1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略,16,六 混合战略纳什均衡,对 的解释: 如果流浪汉以找工作的概率小于0.2, 则政府选择不救济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略. 对 *= 0.5的解释 如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.,17,六 混合战略纳什均衡,混合战略纳什均衡的含义: 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利

7、博弈中, , *=0.5是唯一的混合战略纳什均衡。从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济; 如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。,18,19,六 混合战略纳什均衡,反面,正面,反面,正面,用上述方法:求该猜谜游戏的混合战略纳什均衡,20,激励的悖论:小偷和守卫的博弈混合战略的应用,21,激励的悖论:小偷和守卫的博弈混合战略的应用,加重对守卫的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,22,加重对小偷的处罚:

8、短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒,23,六 混合战略纳什均衡,练习:模型化下述划拳博弈: 两个老朋友在一起喝酒,每个人有四个纯战略:棒子、老虎、鸡和虫子,输赢规则是:棒子打老虎,老虎吃鸡,鸡吃虫子,虫子蛀棒子,两人同时出。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯战略均衡吗?计算其混合战略纳什均衡。,24,七 纳什均衡存在性及相关讨论,不同均衡概念的关系,占优均衡 DSE,重复剔除占优均衡 IEDE,纯战略纳什均衡 PNE,混合战略纳什均衡 MNE,25,七 纳什均衡存在性及相关讨论,纳什均衡存在

9、性定理:每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)。,26,七 纳什均衡存在性及相关讨论,一个博弈可能有多个均衡: 两个人分蛋糕; 性别战中的博弈; 纳什均衡的多重性:博弈论并没有一个一般的理论证明纳什均衡结果一定能出现,芭蕾,女,男,足球,芭蕾,足球,27,七 纳什均衡存在性及相关讨论,如何保证均衡出现: 1、“聚点”均衡:参与人可以使用某些被抽象掉的信息达到一个“聚点均衡”。 两个人分蛋糕; 性别战中的博弈; 两人同时给对方打电话 ,28,七 纳什均衡存在性及相关讨论,2、廉价磋商-“协调博弈” 尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。,R,B,A,U,D,L,聚点,29,七 纳什均衡存在性及相关讨论,猎人博弈中的帕累托优势均衡和风险优势均衡:,打兔,猎人乙,猎人甲,猎鹿,打兔,猎鹿,有两个纳什均衡: (5,5)与 (3,3); 可以认为: (5,5)比(3,3)有帕累托优势 (3,3)比(5,5)有风险优势,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报