收藏 分享(赏)

不完全信息博弈.ppt

上传人:scg750829 文档编号:9484148 上传时间:2019-08-09 格式:PPT 页数:41 大小:340KB
下载 相关 举报
不完全信息博弈.ppt_第1页
第1页 / 共41页
不完全信息博弈.ppt_第2页
第2页 / 共41页
不完全信息博弈.ppt_第3页
第3页 / 共41页
不完全信息博弈.ppt_第4页
第4页 / 共41页
不完全信息博弈.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、2.4不完全信息博弈,本节内容: 不完全信息静态博弈 贝叶斯纳什均衡的应用举例 不完全信息动态博弈,很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即,只拥有不完全信息。每个人知己于必然,知人于或然 引入一个虚拟的参与人:自然。它选择了参与人的特征类型。海萨尼转换。 完全但不完美信息博弈。因为使博弈分析成为可能,故称“完全”,但所知不确,故“不完美” 给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大。,不完全信息静态博弈: 贝叶斯-纳什均衡,不完全信息博弈在信息上,各对手有时势均力敌,可能形成完全信息博弈 其技术标准是:支付函数是共同知识 大量的对

2、局中信息不对称,如 古董(他们坐店收购时从来不先出价,卖猫的故事) 企业选择员工 保险销售 至少有一个人不知道其他人的支付函数,即形成“不完全信息博弈”,不完全信息博弈和贝叶斯纳什均衡,不完全信息博弈例:市场进入博弈 进入者不知道在位者的成本函数,只能猜概率 如果你是高成本,我就进入,预期收益40,如果你是低成本,我就不进入。到底进还是不进?,期望利润:p40+(1-p)(-10).为保证不亏,期望利润为0, 则p=0.2。大于0.2会赚钱。对p的判断就是“贝叶斯理念”,静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到自己的类型,但参与人j只知道除i之外所有参与人类型,但不知

3、道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。,静态贝叶斯博弈,不完全信息博弈和贝叶斯纳什均衡,海萨尼在1967-1968年提出了一个处理不完全信息的方法引入一个虚拟的参与人“自然”,自然首先行动,选择决定参与人的特征(如成本函数),参与人知道自己的特征,其他参与人不知道。这样不完全信息博弈就转换为完全但不完美信息博弈,可以利用标准的分析技术进行分析,这就是“海萨尼转换”。,海萨尼转换,不完全信息博弈和贝叶斯纳什均衡,类型:一个参与人拥有的所有的个人信息(即所有不是共

4、同知识的信息)称为他的类型。根据这个定义,甚至允许参与人不知道其他参与人是否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道自己是高成本还是低成本,只知道进入者有p的概率知道自己的成本函数,(1-p)的概率不知道自己的成本函数。 这种情况下,进入者也有两种类型:知道(在位者的成本)或不知道(在位者的成本)。不完全信息意味着,至少有一个参与人有多个类型。,海萨尼转换,不完全信息博弈和贝叶斯纳什均衡,贝叶斯纳什均衡,贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下,最大化自己的期望效用。,不完

5、全信息博弈和贝叶斯纳什均衡,贝叶斯纳什均衡的定义的理解 如果我是某种类型,则其他人属某类型的概率乘以这种情况下其他人的最好选择时,我所得到的效用。对此乘积加总,找出我的最大效用 贝叶斯均衡相当于“各人的类型之和”下参与人的纳什均衡,不完全信息博弈和贝叶斯纳什均衡,1、不完全信息古诺模型前面已经分析过完全信息静态古诺模型和动态斯坦克尔伯格模型。后者,由于先行者的优势而使均衡结果不同于完全信息下的结果(如果是选择价格,均衡结果不利于先行者) (张维迎P148),贝叶斯纳什均衡的应用举例,qi:第i个企业的产量 Ci:代表第i个企业的成本 假定逆需求函数为: 第i个企业的利润函数为:,1、不完全信息

6、古诺模型,假定a=2, c1=1, c2l=3/4,c2h=5/4。给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:t=a-c=a-3/4=5/4或t=a-5/4=3/4依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:,3 信息与非合作博弈理论,也就是说,企业2的最优产量不仅依赖于企业的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量, q2h为t=3/4时企业2的最优产量。那么,q2l=1/2*(5/4-q1); q2h= 1/2*(3/4-q1)企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最

7、大化下列利润函数:,最优化一阶条件得企业1的反应函数为:,是企业1关于企业2产量的期望值,均衡意味着两个反应函数同时成立,解两个反应函数得贝叶斯均衡为:,2、双方叫价拍卖double auction 两群人各自出价,有中间的拍卖商。 叫价较低者容易卖出,但成交价格有可能高于他的出价;出价高者容易买到,但成交价格有可能低于他的出价 Chatterjee & Samuelson “双方叫价拍卖模型” 假设你卖我买 你觉得这东西值c,要价ps;我觉得这东西值v,要价pb。同时报数 如果你要价较低,成交,价格为中间数 如果你要价较高,不成交,贝叶斯纳什均衡的应用举例,贝叶斯纳什均衡的应用举例,双方叫价

8、拍卖double auction 如果是完全信息,我知道那东西对你意味着什么,你也知道那东西对我来讲值多少钱。 这将形成一个均衡:你我出价相等,皆大欢喜 如果谁想沾便宜,生意就没法做 还可能出现无效率的均衡:双方都没有认真选择价格,漫天要价,坐地还钱,做不成生意,贝叶斯纳什均衡的应用举例,双方叫价拍卖double auction 如果是不完全信息,我不知道那东西对你意味着多少钱,你也不知道那东西对我来讲有多大价值。但可以假设我们互相知道对方的分布函数 根据纳什均衡的定义,我们都选择最大化 根据均衡战略,即使我觉得它值1,但我最多只出3/4,如果想成交,你的要价必须不高于3/4,贝叶斯博弈与混合

9、战略均衡,完全信息混合战略均衡可视为不完全信息纯战略均衡的极限 混合战略均衡的纯化定理,银行挤兑(1) 王则柯“银行挤兑的成因和预防”,两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。,对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。 假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。 如果等到日期2两客户同时要收回资金,则各得140元;如果到日

10、期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。,银行挤兑(2),银行挤兑(3),不完全信息动态博弈,精炼贝叶斯均衡 二手车交易 市场类型 混同均衡与分离均衡 单一价格二手车交易,“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道;在自然选择之后,参与人开始行动,参与人的行动有先后,后行动者能观测到先行动者的行动,但不能观测到其类型 。,不完全信息动态博弈,后行动者可以通过观察而增加对先行者的了解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息

11、。 博弈过程是不仅是参与人选择行动的过程,还是不断学习的过程。,不完全信息动态博弈,精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自己的最优化行为。,精炼贝叶斯均衡,精炼贝叶斯均衡是一个战略组合和一个概论分布,它们满足以下要求: (1)在各个信息集,轮到选择的参与人必须具有一个关于博弈达到该信息集中各决策结的概率的判断(即信息集上的概率分布); (2)给定概率分布和其他参与人的选择,每个参与人的战略是最优的; (3)概率分布是使用贝叶斯法则从最优战略

12、和观测到的行动得到的。,精炼贝叶斯均衡,1、贝叶斯法则,在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。,1、贝叶斯法则,假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,k和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ah,i属于k的后验概率是多少?,精炼贝叶斯均衡,1、贝叶斯法则,人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个好人干好事的概率等于

13、他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):ProbGT= p(GT|GP)* p(GP)+ p(GT|BP)* p(GT|BP),精炼贝叶斯均衡,1、贝叶斯法则,假定观测到一个人干了一件好事,那么这个人的是好人的后验概率是:,假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:,精炼贝叶斯均衡,1、贝叶斯法则,1)是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p(GT|BP)=02)这是一个非常一般的好事,好人会干,坏人也会干:p(

14、GT|GP)=1 p(GT|BP)=1,精炼贝叶斯均衡,3)介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2 p(GT|BP)=1/2,1、贝叶斯法则,精炼贝叶斯均衡,假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。,假定我们原来认为他是个好人,大突然发现他干了一件好事,我们如何看待呢?,1、贝叶斯法则,精炼贝叶斯均衡,1)在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念); 2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的; 3)每一个参与人根据

15、贝叶斯法则和均衡战略修正后验概率。,2、精炼贝叶斯均衡,精炼贝叶斯均衡,博弈顺序: 1)“自然”首先选择参与人1的类型,参与人1知道,但参与人2不知道,只知道1属于该类型x的先验概率。 2)参与人1观测到类型x后发出信号。 3)参与人2观测到参与人1发出的信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动。,2、精炼贝叶斯均衡,精炼贝叶斯均衡,二手车交易,假定你现在到二手车市场去买一辆旧车,到了市场后,你却发现不知道每辆旧车真正的质量究竟怎样,因为它们看起来都象新车一样。 但通常卖方对旧车的质量要清楚得多。现在假定二手车只有“好”和“差”两种类型,卖者知道而买者不知道;不管好、差,卖者都

16、有两种选择:卖或不卖,买者有“买”和“不买”两种选择。,二手车交易的扩展式表述:首先,卖者确定旧车质量;其次,卖者决定是卖还是不卖;最后,在卖者卖车的情况下,买者确定买还是不买。,二手车交易,市场类型,市场完全失败:所有卖方担心商品卖不出去而不卖,市场交易不存在。 市场完全成功:只有质量好的商品才被卖,而质量差的卖方不敢卖。市场上的商品都是好的。 市场部分成功:所有卖方不管商品好坏都卖,买方不管商品好坏都买,交易总是能够完成。 市场接近失败:所有好商品都被投放在市场,只有部分坏商品被投放,但买者按一定概率购买市场上的商品。,混同均衡与分离均衡,在有的市场中,所有的卖方(具有完美信息)都采取相同

17、的选择(卖或不卖),而不管商品的“好”“坏”(如市场完全失败中所有卖方都不卖,市场部分成功中所有卖方都卖)。 这种完美信息的参与人完全采取相同的行为的市场均衡被称为“混同均衡”。,而另外一些市场,拥有不同质量商品的卖方采取的选择却截然不同(如完全成功中,好商品的卖方选择卖,差商品的卖方选择不卖)。 这种具有完美信息的参与人采取完全不同的选择的市场均衡被称为“分离均衡”。,二手车博弈:单一价格模型,假定:二手车有好、差两种情况,对买方来讲价值分别为V和W (VW);卖方不管旧车好坏都只能以一种价格P出售(即差车如果出低价将没有人买)。但是,差车必须花费一定的伪装成本C才能诱使买者购买。,二手车博

18、弈:单一价格模型,情形I:如果VPW,差车子出现的概论P(b)很小,即买方相信还是好的车子占绝大多数,并且PC,则下列策略组合和判断构成一个市场部分成功的精炼贝叶斯均衡(混同均衡): (1)卖方选择卖,不管车子好或差; (2)买方选择买,只要卖者卖; (3)买方的判断为P(g|s)=P(g),P(b|s)=P(b)。 g=good b=bad s=sell,情形II:假定PC,即要把差车伪装成好车很费钱。下列策略组合和判断构成一个市场完全成功的精炼贝叶斯均衡(分离均衡): (1)卖方在车况好时选择卖,车况差时选择不卖。 (2)买方选择买,只要卖方卖。 (3)买方的判断是P(g|s)1,P(b|s)=0,情形III:在某些特殊时候,可能出现一些最悲观的情况,即买方根据以往的经验,判断当卖方选择卖时一定是车况差的,则下列策略和判断构成市场完全失败的精炼贝叶斯均衡: (1)卖方总选不卖; (2)买方总选不买; (3)P(g|s)=0, P(b|s)=1,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报