收藏 分享(赏)

第二讲(1)完全信息静态博弈.ppt

上传人:天天快乐 文档编号:1153586 上传时间:2018-06-15 格式:PPT 页数:31 大小:613KB
下载 相关 举报
第二讲(1)完全信息静态博弈.ppt_第1页
第1页 / 共31页
第二讲(1)完全信息静态博弈.ppt_第2页
第2页 / 共31页
第二讲(1)完全信息静态博弈.ppt_第3页
第3页 / 共31页
第二讲(1)完全信息静态博弈.ppt_第4页
第4页 / 共31页
第二讲(1)完全信息静态博弈.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、第二讲(1) 完全信息静态博弈,所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题纳什均衡无限策略博弈的解和反应函数混合策略纳什均衡的存在性,2.1 纳什均衡,博弈的解和纳什均衡严格下策反复消去法与纳什均衡,2.1.1博弈的解和纳什均衡,定义 在博弈 中,如果策略组合 中任一博弈方i的策略 都是对其余博弈方的策略组合 的最佳对策,也即 对任意 都成立,则称 为G的一个纳什均衡。,2.1.1博弈的解和纳什均衡,划线法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 箭头法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白,2.1.2严格下策反复消去法

2、与纳什均衡,严格下策:对于某一策略 ,若 则称 为 的严格下策。命题2.1 在n个博弈方的博弈 中,如果严格下策反复消去法排除了 以外的所有策略组合,则 一定是G的唯一的纳什均衡。命题2.2 在n个博弈方的博弈 中,如果 是G的一个纳什均衡,则严格下策反复消去法一定不会将它消去。,2.1纳什均衡,纳什均衡点是一种局部均衡点,可以有很多个,也可以不存在。来源于策略组合的策略可能有n!个(离散),也可能无穷多个(连续),那么求解将会十分烦琐。得益 对于任一策略(s1,sn),其总得益为各博弈方得益之和 那么对于具有多个纳什均衡点的博弈,则对应的应有最优纳什均衡的概念,而对应于最优纳什均衡的点为全局

3、最优点。此处最优的含义为稳定性而不是得益之和最大。如何均衡稳定与收益?,2.2 无限策略的解和反应函数,古诺的寡头模型反应函数伯特兰德的寡头模型公共资源问题,2.2.1古诺的寡头模型,博弈方1利润: 博弈方2利润: 在本博弈中, 的纳什均衡的充分必要条件是 和 的最大值问题: 社会收益最大化: 假设总产量为Q,总收益为UQP(Q)CQ Q(8-Q)2Q6QQ2 其最大值为Q*=3,U=9 该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。,2018/6/15,9,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂商1,以自

4、身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,2.2.2 反应函数,反应函数每个博弈方针对其他博弈方所有策略的最佳反应构成的函数。而各个博弈方反应函数的交点(如果有的话)就是纳什均衡。,2.2.2 反应函数古诺模型,在古诺模型中厂商1和厂商2的反应函数分别为,q2,q1,(0,6),(0,3),R1(q2),R2(q1),(2,2),6,0,(3,0),(6,0),从左图可以看出,当一方的选择为0时,另一方的最佳反应为3,这正是我们前面所说过的实现总体最大利益的产量,因为一家产量为零,意味着另一家垄断市场。

5、当一方的产量达到6时,另一方则被迫选择0,因为实际上坚持生产已无利可图。,2.2.3 伯特兰德的寡头模型,在该模型中厂商选择价格而不是产量厂商1的价格与需求函数: P1, 厂商2的价格与需求函数: P2, 其中,d1,d20为两厂商产品的替代系数。假设两厂商无固定成本,边际成本分别为c1和c2。收益:纳什均衡:,2018/6/15,13,公共地悲剧,英国人哈定:十八世纪以前,苏格兰地区大量草地,由于属公共资源导致过度放牧,致使草地消失,生态破坏,2.2.4公共资源问题,2018/6/15,14,公共产品的供给 如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不

6、偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。军备竞赛 两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。经济改革 经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。,2.2.4公共资源问题,2.2.4公共资源问题,公共资源 (1)没有哪个个人、企业或其他经济组织拥有;(2)大家都可以自由利用这两个特征的自然资源或人类生产的供大众免费使用的设施或财货。例 设某村庄有n个农

7、户,一公共草地,可养羊数为qi(i=1,n)为n个农户各自的策略空间,当各户养羊数为q1,qn时,总数为Q q1 qn,每只羊的产出为羊的总数Q的减函数VV(Q)=V(q1 qn),假设每只羊的成本为c,则农户i养qi只羊的得益为:ui= qiV(Q)-qic,2.2.4公共资源问题实例,设n3,V100Q100(q1q2q3),c4 三农户的得益函数和反应函数: u1q1100(q1q2q3)4q1, q1R1(q2,q3)=48-0.5q2-0.5q3 u2q2100(q1q2q3)4q2, q2R1(q1,q3)=48-0.5q1-0.5q3 u3q3100(q1q2q3)4q3, q3

8、R1(q1,q2)=48-0.5q1-0.5q2 纳什均衡: q1*=q2*=q3*=24, u1*=u2*=u3*=576 最大总体收益:u*=2304 Q*=48 由此说明,纳什均衡的解常常是低效率的,而在现实生活中却经常出现。如果采取最佳策略(集体理性),那么个体的贪婪性将会来破坏这一平衡。,2.3 混合策略,概念应用,2.3.1 概念的提出,在前面的例子,如猜硬币,齐威王田忌赛马,夫妻之争等博弈问题不存在纳什均衡策略组合,然而这类问题十分常见。 例1 小偷与守卫的博弈 守卫 睡 不睡 小 偷 偷 不偷,2018/6/15,19,小偷和守卫的博弈,加重对首位的处罚:短期中的效果是使守卫真

9、正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,2.3.1 概念的提出,2018/6/15,20,加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,小偷和守卫的博弈,猜硬币博弈,猜硬币方 正面 反面 盖 硬 正面 币 方 反面该博弈与上一个例子相似,即取胜的关键都是不 能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。若p1/2,则猜硬币方全猜正面,他的期望得益为p1+(1-p) (-1)=2p-10,即平均来说,猜硬币方赢多输少。,例2 猜硬币 1.若被对手事先知道出现哪一面,肯定输 2.若正面出现的概率为p,负面为1-p,且p0.

10、5,则猜正面的话赢的几率就比较大。,2.3.1 概念的提出,2018/6/15,22,混合策略反应函数,猜硬币博弈,2018/6/15,23,混合策略反应函数,猜硬币博弈,2.3.1 概念的提出,特点:1.自己的选择不能让对手预先知道2.若重复多次,则不让对手发现其中的规律。除非有意输(一种行贿的手段),注意行贿只是一个手段,有意无意间让对手了解自己的策略或规律。,2.3.1 概念的提出,定义:在博弈G=s1,sn;u1,un中,博弈方i的策略空间为Si=si1,sik,则博弈方i以概率分布pi=(pi1,pik)随机选择其k个可选策略称为一个“混合策略”,其中0pik1对k=1,k都成立且p

11、i1+pik=1。相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”混合策略的原则:自己的策略选择不能被另一方预知或猜到。即在决策时利用随机性。选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。,2.3.2 应用,博弈方1选A、B的概率:pA,pB;博弈方2选C、D的概率:pC,pD。原则应用:博弈方1选A和B的概率pA和pB一定要使博弈方2选C的期望得益和选D的期望得益相等。即 pA 3 pB1 pA 2 pB5又由pA pB1,可得 pA0.8, pB0.2,此即博弈方1应选的混合策略。 同理可得博弈方2的

12、混合策略为 pC0.8, pD0.2。纳什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e pA. pC. u1(A,C) pA. pD. u1(A,D) pB. pC. u1(B,C) pB. pD. u1(B,D)2.6 u2e2.6 单独一次博弈的结果可能是四种状态的任何一种,然而多次独立重复博弈得到如上的结果是可能的。,2 C D A 1 B,2.3.2 应用,混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。例 夫妻之争 该博弈与上一个博弈的不同之处在 于每一方所希望对方知道自己的策略选 择以达到有利于自己的结果。

13、现实中, 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe0.67, uhe0.75。,丈 夫 时装 足球妻 时装子 足球,2018/6/15,28,2.3.2 应用,混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。例 夫妻之争 该博弈与上一个博弈的不

14、同之处在 于每一方所希望对方知道自己的策略选 择以达到有利于自己的结果。现实中, 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe0.67, uhe0.75。,丈 夫 时装 足球妻 时装子 足球,夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3)

15、 0.75,2018/6/15,29,2018/6/15,夫妻之争博弈,混合策略反应函数,2.4 纳什均衡的存在性,允许采取混合策略的情况下,是否每个博弈都有纳什均衡?纳什定理 在一个有n个博弈方的博弈Gs1,sn;u1,un中,如果n是有限的,且si都是有限集(对i1,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。,2.5 博弈论与优化问题,一个最优的决策(判定)序列,具有下列性质:不论初始的状态和策略如何,余下的策略必须相对于前一次决策产生的新状态构成一个最优决策序列。离散 组合 连续 混沌稳性 混沌 混沌的基本特征:小参数变化引起结果的不可预测计算机的有限性 应用: 非线性经济学和谐理论 非理性问题(在经济学中的基本假设)洛仑兹效应蝴蝶效应更深一层次的反思 是否可由现象找出原因因果律,经济系统的测不准性与预测经济解释与非线性经济学的研究结果,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报