收藏 分享(赏)

博弈论第四讲.ppt

上传人:精品资料 文档编号:10578383 上传时间:2019-12-02 格式:PPT 页数:45 大小:2.39MB
下载 相关 举报
博弈论第四讲.ppt_第1页
第1页 / 共45页
博弈论第四讲.ppt_第2页
第2页 / 共45页
博弈论第四讲.ppt_第3页
第3页 / 共45页
博弈论第四讲.ppt_第4页
第4页 / 共45页
博弈论第四讲.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、不完全信息静态博弈,作者:朱怀念 经贸学院 ,管理学院 School of Management,不完全信息静态博弈-贝叶斯纳什均衡,一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡 二 贝叶斯纳什均衡应用举例,不完全信息博弈-无法避免的不确定性,在前面的分析中,我们假定每个参与人对所有其他参与人的支付函数是完全了解的,即支付函数是所有参与人的共同知识(Common Knowledge),满足这一假设的博弈称为完全信息博弈。 如果在博弈中,至少有一个参与人不知道其他参与人的支付函数,则称该博弈为不完全信息博弈。 一些不完全信息的

2、例子:与一个陌生人打交道购买一副艺术品一个企业想进入一个市场参与投标的各个厂商消费者不知道企业产品的真正质量用人单位不知道应聘者的真实水平和能力二手车市场,买家不知道车的真实状况,不完全信息博弈“空城计”,街亭失守,司马懿引大军蜂拥而来,当时孔明身边只有一班文官,军士一半已经运粮草去了,只有2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而望,焚香操琴。司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。又接

3、到远山中可能有埋伏的情报,于是叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故做此态,父何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏,我兵若进,必中计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,弃城而去,必为之所擒。”,不完全信息博弈“空城计”,分析这个博弈 参与人 战略 支付 画出这个博弈的战略式或扩展式表述,不完全信息博弈信息的重要性,司马懿,诸葛亮,弃城,守城,进攻,撤退,司马懿:兵多将广,但不知道自己和对方在不同行动战略下的支付; 诸葛亮:处于

4、劣势,但知道博弈的结构,比对方掌握更多的信息。计策:使用各种手段迷惑司马懿,为的是不让对方知道其战略的结果(支付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主 观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。,司马懿关于自己战略的支付的信息是不完全的。,不完全信息,在信息不充分的情况下,博弈参与人不是使自己的支付或效用最大,而是使自己的期望效用或支付最大。如果让你在“50%的概率获得100元”与“10%的概率获得200元”两者之间选择的话,不完全信息决策意味着你会选择前者。因为前者的期望所的是50元,而后者仅为20元,故选

5、前者。,不完全信息博弈,不接受,求爱者,求爱,不求爱,接受,不接受,你,求爱者,求爱,不求爱,接受,你,100x+(-100)(1-x)=0 当x大于1/2时,接受求爱,求爱博弈: 品德优良的求爱者(x),求爱博弈: 品德恶劣的求爱者(1-x),被求爱者对于求爱者的品德的信息是不完全的。,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,房地产开发博弈,不完全信息博弈,市场需求信息是不完全的。,一个简例:市场进入博弈,一个企业决定是否进入一个新的产业,但不知道在位企业的成本函数,也不知道一旦进入,在位者决定默许还是斗争。

6、 假定在位者有两种可能的成本函数:高成本或低成本;对应两种成本情况下的不同战略组合下的支付矩阵如下表:,默许,斗争,默许,斗争,进入,不进入,在位者,进入者,高成本情况,低成本情况,默许,斗争,默许,斗争,进入,不进入,在位者,市场进入博弈:不完全信息,进入者,高成本情况,低成本情况,进入者有关在位者成本信息是不完全的,如果在位者是高成本:进入者的最优选择是进入,在位者的最优选择是默许;,一个简例:市场进入博弈,默许,斗争,默许,斗争,进入,不进入,在位者,市场进入博弈:不完全信息,进入者,高成本情况,低成本情况,进入者有关在位者成本信息是不完全的,如果在位者是低成本:进入者的最优选择是不进入

7、,在位者的最优选择是斗争(一旦低成本者进入),一个简例:市场进入博弈,默许,斗争,默许,斗争,进入,不进入,在位者,市场进入博弈:不完全信息,进入者,高成本情况,低成本情况,进入者有关在位者成本信息是不完全的,但进入者不知道在位者究竟是高成本还是低成本,因此,进入者的最优选择依赖于他对在位者的信念,一个简例:市场进入博弈,假定进入者认为在位者是高成本的概率为p,则是低成本的概率为1-p。 进入者选择“进入”的期望支付是:p40+(1-p) (-10) 进入者选择“不进入”的期望支付是0 比较上面两个表达式,可知进入者的最优选择为: 如果p1/5,进入;如果p1/5,不进入。,一个简例:市场进入

8、博弈,目录导航,一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡 二 贝叶斯纳什均衡应用举例 三 贝叶斯纳什均衡与混合战略均衡,海萨尼转换,默许,斗争,默许,斗争,进入,不进入,在位者,市场进入博弈:不完全信息,进入者,高成本情况,低成本情况,进入者似乎在与两个不同的在位者博弈,一个是高成本的在位者,一个是低成本的在位者; 一般地,如果在位者有T种不同的成本函数,进入者就相当于与T个不同的在位者博弈。,海萨尼转换,默许,斗争,默许,斗争,进入,不进入,在位者,市场进入博弈:不完全信息,进入者,高成本情况,低成本情况,1967年以

9、前,博弈论专家认为这样的不完全信息是没法分析的,因为当一个参与人并不知道他在与谁博弈时,博弈的规则是没有定义的。 海萨尼通过引入一个虚拟的参与人“自然”,将不完全信息博弈转换为完全但不完美信息博弈,从而可以用完全信息博弈论进行处理,这就是著名的“海萨尼转换”(Harsainyi Transformation)。,私人信息(Private Information):共同知识之外的信息;只有参与人i知道,其他参与人不知道的信息。 例如,C2=C2l?还是C2=C2h?厂商2自己知道,厂商1不知道,C2是厂商2的私人信息。 类型(type):对参与人私人信息的一个完备描述 不完全信息意味着,至少有一

10、个参与人有多个类型。,海萨尼转换,说参与人i知道自己的支付函数等同于说参与人i知道自己的类型,类似地,说参与人i可能不确定其他参与人的支付函数,也就等同于说参与人i不能确定其他参与人的类型。 i表示参与人i的第k种类型(参与人i共有K种类型); i表示参与人i的类型空间(类型集),即i=1, K; = (1, n)表示一个类型组合。 -i=(1, i-1, i+1,n)表示除参与人i之外的其他参与人的类型组合。 注意:i=1, K及Pi(1, K) 是Common Knowledge,引入一个虚拟的参与人“自然”,记为N。无须确定它的支付函数;它的唯一作用是确定i=1, K及Pi(1, K )

11、 N把参与人i的真实类型只告诉参与人i自己,把i=1, K及Pi(1, K )告诉所有参与人; 所有参与人同时行动,从各自的Ai(i)中选择ai (i) ; 除N之外所有参与人的支付函数为ui(ai,a-i;i)。 由此,某个参与人对参与人i的类型的不确定转变成N决定参与人i的类型,从而可以利用贝叶斯法则进行分析。,海萨尼转换,海萨尼转换,下图就是市场进入博弈问题,经过海萨尼转换后,得到的博弈树。,在不完全信息静态博弈中,所有参与人同时行动,其战略空间等于行动空间,但是参与人i的行动空间可能依赖于其类型,也就是行动空间是类型依存的。 比如企业能选择什么产量依赖于它的成本函数,一个人能干什么依赖

12、于他的能力,等等。 类似的,参与人i的支付函数也是类型依存的,比如说,生产相同的产量,不同成本函数的企业利润就不同;工作同样的时间,不同类型的人得到的效用不同。用ui(ai,a-i; i)表示参与人i的效用函数。可以用这些参数表示一个静态贝叶斯博弈。,海萨尼转换,说明,根据海萨尼公理:假定参与人类型的分布函数P(1, n)是所有参与人的共同知识。 以市场进入博弈为例,在位者高成本的概率p是共同知识意味着:进入者知道在位者是高成本的概率为p,进入者知道在位者知道进入者知道在位者是高成本的概率为p,如此等等,即在博弈开始时,所有参与人有关自然行动的信念(belief)是相同的。,真正的“信息不对称

13、”,一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫很感兴趣,要丛主人手里买下,主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意地说:这个碟子它已经用惯了,就一块送给我吧。猫主人不干了:你知道用这个碟子,我已经卖了多少只猫了?,练习-将下列博弈进行海萨尼转换,不接受,求爱者,求爱,不求爱,接受,不接受,你,求爱者,求爱,不求爱,接受,你,求爱者品德优良的概率是p,求爱博弈: 品德优良者求爱,求爱博弈: 品德恶劣者求爱,被求爱者对于求爱者的品德的信息是不完全的,目录导航,一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯

14、纳什均衡 二 贝叶斯纳什均衡应用举例,静态贝叶斯博弈定义,n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间1, , n,条件概率p1, pn,类型依存战略空间A1(1), An(n)和类型依存支付函数u1(a1,an; 1),,un(a1,an; n)。参与人i知道自己的类型ii,条件概率pi=pi(-ii)描述给定自己属于i的情况下,参与人i有关其他参与人类型-i-i的不确定性。可以用G=A1,An; 1,n; p1,pn; u1,un代表这个博弈。 静态贝叶斯博弈的时间顺序为: 1、自然选择类型向量=(1, n) ,参与人i观测到i,但参与人j(i)只知道pj(-jj),观测不到i;

15、2、n个参与人同时选择行动a=(a1,an),其中ai(i)Ai(i); 3、参与人i得到类型依存支付函数ui(a1,an; i)。,静态贝叶斯博弈定义,给定参与人i只知道自己的类型i而不知道其他参与人的类型-i ,参与人i将选择行动ai(i)最大化自己的期望效用。参与人i的期望效用函数定义为vi=pi(-ii)ui(ai(i), a-i(-i);i,-i) 战略:在n人静态贝叶斯博弈G=A1,An;1,n; p1,pn; u1,un中,参与人i的战略是一个类型依存函数ai(i) ,其中对i中的每一个类型i,ai(i)包含了自然赋予i的可能类型为ai(i)时,i将从自己的战略空间Ai(i)中中

16、选择战略ai(i)。,静态贝叶斯博弈定义,贝叶斯纳什均衡:n人不完全信息静态博弈G=A1,An;1,n;p1,pn;u1,un的纯战略均衡是一个类型依存战略组合ai*(i)ni=1 ,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略a-i*(-i)的情况下,最大化自己的期望效用函数vi 。 与纯战略纳什均衡不同的是,在贝叶斯均衡中参与人i只知道具有类型j的参与人j将选择aj(j)但并不知道j。因此,即使纯战略选择也必须取支付函数的期望值。,市场进入博弈,在市场进入的例子里,均衡战略是:高成本的在位者选择默许,低成本的在位者选择斗争;只有当在位者是高成本的概率p1/5时,进入者才选择进

17、入,否则不进入。,目录导航,一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡 二 贝叶斯纳什均衡应用举例,不完全信息古诺特模型,企业1,企业2,参与人:企业1、企业2; 行动顺序:同时行动 不完全信息:企业1单位成本c1是共同知识,企业2的成本可能是c2l或c2h,企业1只知道c2=c2l的可能性是1/2,这是共同知识。,在不完全信息古诺特模型里,参与人的类型是成本函数。,不完全信息古诺特模型,qi :第i个企业的产量 假定逆需求函数为: 第i个企业的利润函数为:,假定a=2, c1=1, c2l=3/4,c2h=5/4。 给定

18、企业1选择q1 ,企业2将选择q2最大化利润函数:式中,t=a-3/4=5/4或t=a-5/4=3/4,依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:,不完全信息古诺特模型,不完全信息古诺特模型,也就是说,企业2的最优产量不仅依赖于企业1的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量, q2h为t=3/4时企业2的最优产量。那么,q2l=1/2*(5/4 - q1); q2h= 1/2*(3/4 - q1)企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化下列利润函数:,不完全信息古诺特模型,最优化一

19、阶条件得企业1的反应函数为:,是企业1关于企业2产量的期望值。,均衡意味着两个反应函数同时成立,解两个反应函数得贝叶斯均衡为:,这里,,拍卖理论简介,拍卖或招标有两个基本功能,一是揭示信息,二是减少代理成本。 拍卖是博弈论重要的分支。 著名拍卖理论专家维克利(Vickrey),由于在拍卖及在拍卖基础上衍生的机制设计理论的一些原创新工作,获得了1996年的诺贝尔经济学奖。,一级密封价格拍卖(招标),当一件物品对买者的价值买者比卖者更清楚时,卖者一般不愿意首先提出价格,而常常采用拍卖的方式以获得可能的最高价格。这种情况在古董和名画的交易中特别普遍。 一级密封价格拍卖是许多拍卖方式中的一种。在这种拍

20、卖中,投标人同时将自己的出价写下来装入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是赢者,按他的出价支付价格,拿走被拍卖的物品。这里,每个投标人的战略是根据自己对该物品的评价和对其他投标人评价的判断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其他投标人的支付为零。,首先考虑两个投标人的情况 ,i=1,2。令bi0是投标人i的出价,vi为拍卖物品对投标人i的价值。假定vi只有i知道(因而vi是投标人i的类型),但两个投标人都知道vi独立地取自定义在区间0,1上的均匀分布函数。投标人i的支付如下:这里,我们假定如果两个投标人出价相同,拍卖品在两人之间随机的分配。,一级密封价

21、格拍卖(招标),假定投标人i的出价bi(vi)是其价值vi的严格递增可微函数。显然,bi1vi不可能是最优的,因为没有人愿意付出比物品价值本身更高的价格。由于博弈的对称性,我们可只需考虑对称的均衡出价战略:b=b*(v) 。给定v 和b,投标人i的期望支付为:这里Prob()代表bjb的概率,其中bj是投标人j的出价战略。因为出价战略是严格递增的,Prob( bjb )= Prob( bjb )。期望支付的第一项(v-b)是给定赢的情况下投标人i的净所得,第二项Prob()是赢的概率。,一级密封价格拍卖(招标),根据对称性, bj=b*( vj ),所以这里,(b)是b*的逆函数(即当投标人选

22、择b时他的价值是(b))。因此,投标人i面临的问题是:最优化的一阶条件是:,一级密封价格拍卖(招标),如果b*()是投标人i的最优策略,(b)=v。因此,上述微分方程可以写成:解得: 就是说,这个博弈的贝叶斯均衡是。每个投标人的出价是其实际价值的一半: 。在均衡情况下,被拍卖品归评价最高的投标人所有,这从资源配置的角度讲是有效率的,但卖者只得到买者价值的一半。,一级密封价格拍卖(招标),可以证明,投标人出价与实际价值之间的差距随投标人数的增加而递减。假定有n个投标人,每个投标人的价值vi具有独立的、相同的定义在0,1区间上的均匀分布,如果评价为v的投标人i出价b,他的期望支付函数为:最优化的一阶条件为: 或,一级密封价格拍卖(招标),一级密封价格拍卖(招标),因为在均衡情况下(b)=v,一阶条件可以写成: 解上述微分方程得: 显然,b*(v)随着n的增加而增加。特别地,当n时, b* v 。就是说,投标人越多,卖方能得到的价格就越高;当投标人趋于无穷时,卖方几乎可以得到买方价值的全部。所以,让更多的投标人加入竞标是卖方的利益所在。在公共管理中,政府的采购和公共工程招投标中通常规定要进行公开招标,并在参加竞标的公司数目上有下限规定,其缘故正是如此,因为更多的竞争者参加投标会压低工程报价,从而使政府开支得到一定程度的节省。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报