收藏 分享(赏)

博弈论与信息经济学讲义09-5.ppt

上传人:hwpkd79526 文档编号:4374927 上传时间:2018-12-25 格式:PPT 页数:120 大小:1.11MB
下载 相关 举报
博弈论与信息经济学讲义09-5.ppt_第1页
第1页 / 共120页
博弈论与信息经济学讲义09-5.ppt_第2页
第2页 / 共120页
博弈论与信息经济学讲义09-5.ppt_第3页
第3页 / 共120页
博弈论与信息经济学讲义09-5.ppt_第4页
第4页 / 共120页
博弈论与信息经济学讲义09-5.ppt_第5页
第5页 / 共120页
点击查看更多>>
资源描述

1、博弈论与信息经济学 (Game Theory and Information Economics ),张玲玲 中国科学院研究生院管理学院 ,主要内容简介,第一章 概述-人生处处皆博弈第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡 第三章 完全信息动态搏弈-子博弈精炼纳什均衡 第四章 不完全信息静态博弈-贝叶斯纳什均衡 第五章 不完全信息动态博弈-精练贝叶斯纳什均衡,第二篇 信息经济学第六章 委托-代理理论(I)第七章 委托-代理理论(II)第八章 逆向选择与信号传递,主要内容简介,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈的基本概念与扩展式表述 二 子博弈精练纳什均衡

2、 三 应用举例,一 、博弈的基本概念,博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。,一 博弈的基本概念,案例- 房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿,假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7

3、千万; 如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿,一 、博弈的基本概念,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,一 、博弈的基本概念,参与人:博弈论中选择行动以最大化自己效用的决策主体。 可以是自然人,也可以是团体,如企业、国家甚至由若干 国家组成的集团(OPEC、欧盟等)。虚拟参与人:“自然”作为虚拟参与人 自然:指决定外生的随机变量的机制 为分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数(即所有结果对它是无差异的) 参与人决策的后果依赖于自然的选择。在

4、不完全信息博弈中,自然选择参与人的类型,第一章 概述-人生处处皆博弈,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968),不接受,求爱博弈: 品德优良者求爱,求爱者,求爱,不求爱,接受,你,求爱者,求爱,不求爱,求爱博弈: 品德恶劣者求爱,你,100x+(-100)(1-x)=0 当x大于1/2时,接受求爱,自然选择参与人的类型,不接受,接受,一 、博弈的基本概念,行动:参与人在某个时点的决策变量 Ai表示第i个参与人的一个特定行动行动的顺序:行动的顺序对于博弈的结果是非常重要的,事实上,不同的行动顺序意味着不同的博弈。在博弈论中,一般假

5、设参与人的行动空间和行动顺序是所有参与人的共同知识。,不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968),不接受,求爱博弈: 品德优良者求爱,求爱者,求爱,不求爱,接受,你,求爱者,求爱,不求爱,求爱博弈: 品德恶劣者求爱,你,100x+(-100)(1-x)=0 当x大于1/2时,接受求爱,行动,自然选择参与人的类型,不接受,接受,一 、博弈的基本概念,信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识。如求爱博弈中,如果被求爱者不知道求爱者到底是品德优良还是品德坏,而求爱者知道,则被求爱者的信息集为优良,恶劣,求爱者的信息集为优良或恶劣 完美信息:指一个参与人

6、对其他参与人(包括“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。 完全信息:指自然不首先行动或自然的行动的初始行动所有参与人观察到的情况。 共同知识:指“所有参与人知道所有参与人知道所有参与人知道.”的知识。,博弈的信息结构分类,一 、博弈的基本概念,战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。,在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。,一 、博弈的基本概念,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大

7、的情况,博弈的战略式表述,一 、博弈的基本概念,人不犯我,我不犯人,人若犯我,我必犯人. 如果B在不知道市场需求的情况下先行动,A在得知B的行动后再选择自己的行动,那么: B有两个战略SB(开发,不开发) A有四个战略SA(开发,开发,开发,不开发,不开发,开发,不开发,不开发) 这里,战略x,y内的第一个元素对应B选择“开发”时A的行动,第二个元素对应B选择“不开发”时A的行动. S=(不开发,开发,开发)是一个战略组合,在这个战略组合中,A的战略是“如果B开发,我不开发;如果B不开发,我开发”,B的战略是开发.,一 、博弈的基本概念,支付函数:参与人从博弈中获得的效用水平,或者指参与人得到

8、的期望效用水平。博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择,不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968),不接受,求爱博弈: 品德优良者求爱,求爱者,求爱,不求爱,接受,你,求爱者,求爱,不求爱,求爱博弈: 品德恶劣者求爱,你,100x+(-100)(1-x)=0 当x大于1/2时,接受求爱,自然选择参与人的类型,不接受,接受,一 、博弈的基本概念,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,一 、博弈的基本概念,结果:博弈分析

9、感兴趣的所有东西如均衡战略组合、均衡行动组合、均衡支付组合等。如:(高需求,开发,开发)-均衡行动组合(4000,4000)-均衡支付组合S=(不开发,开发,开发)-均衡战略组合,一 、博弈的基本概念,均衡:所有参与人的最优战略的组合 一般记为:,房地产开发博弈中,如果需求大,(开发,开发)是唯一的均衡.,一 、博弈的基本概念,博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的

10、集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。,博弈的战略式表述与扩展式表述,战略式表述:适用于静态博弈 扩展式表述:适用于动态博弈,博弈的战略表述,案例- 房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿,假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7千万; 如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿,博弈战略表述,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略

11、式表述,博弈的战略式表述包括三个要素: 参与人集合 每个参与人的战略集合 由战略组合决定的每个参与人的支付,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布,房地产开发博弈,博弈扩展式表述,一 博弈扩展式表述,博弈的基本构造 结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终

12、点. 结满足传递性和非对称性 x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的集合称为x的后续集T(x)。 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结: 1 每个决策结都是同一个参与人的决策结; 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,

13、0),(0,8),(0,0),(0,1),(0,0),B在决策时不确切地知道自然的选择;B的决策结由4个变为2个,房地产开发博弈,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策),房地产开发博弈,一 博弈扩展式表述,只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。 自然总是假定是单结的,因为自然在参

14、与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。 不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。,B知道自然的选择;但不知道A的选择(或A、B同时决策)A既不知道N也不知道B的选择,N,开发,不开发,A,A,大,小,1/2,1/2,B,B,B,A,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),房地产开发博弈,开发,不开发,N,开发,不开发,B,B,大,小,1/2,1/2,A,A,A,A,开发,不

15、开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策)A?,房地产开发博弈,开发,不开发,二 占优战略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,A,B,坦白,抵赖,B,B,A,A,坦白,抵赖,坦白,抵赖,(-8,-8),(0,-10),(-10,0),(-1,-1),坦白,抵赖,坦白,抵赖,坦白,抵赖,(-8,-8),(0,-10),(-10,0),(-1,-1),囚徒困境博弈的扩展式表述,囚徒困境博弈的扩展式表述,智猪博弈

16、的扩展式表述?,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 子博弈精练纳什均衡 扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 三 应用举例,博弈的划分:,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间

17、依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。 子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。,一 、博弈的基本概念及战略表述,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,扩展式,A,开发,不开发,B,B,开发,不开发,开发,(-3,-3),(1,0),(0,1),(0,0),不开发,x,x,纳什均衡与均衡结果: 存在三个纯战略纳什均衡:(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 两个均衡结果:(开

18、发,不开发)(不开发,开发) 注意:均衡不同于均衡结果,到底哪一个均衡结果将最终出现?,需求小的情况,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 子博弈精练纳什均衡 扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问

19、题 三 应用举例,战略的表述,战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。,在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。,扩展式表述博弈的纳什均衡,足球,男的策略:足球,芭蕾 选择足球; 还是选择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。,策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩

20、展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。,什么是动态博弈?,扩展式表述博弈的纳什均衡,若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发); B有两个信息集,四个可选择的行动,B有四个纯战略: 开发策略:不论A开发不开发,我开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 不开发策略不论A开发不开发我不开发, 简写为: (开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应A选择“开发”时B的选择

21、,第二个元素对应A选择“不开发”时B的选择。,什么是参与人的战略?,扩展式,开发,开发,开发,不开发,不开发, 开发,不开发,不开发,开发,不开发,开发商B,开发商A,战略式,纳什均衡与均衡结果: 存在三个纯战略纳什均衡:(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 两个均衡结果:(开发,不开发)(不开发,开发) 注意:均衡不同于均衡结果,扩展式,开发,开发,开发,不开发,不开发, 开发,不开发,不开发,开发,不开发,开发商B,开发商A,战略式,开发,(开发,开发),路径 在扩展式博弈中,所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。 (开发,不开发

22、,开发)决定了博弈的路径为A开发B不开发-(1,0) (不开发,开发,开发)决定了路径:?,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 子博弈精练纳什均衡 扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 三 应用举例,子博弈精炼纳什均衡,泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。,子博弈精炼纳什均衡-不可置信威

23、胁,美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的

24、告状威胁是不可置信的。,扩展式,纳什均衡与均衡结果: 存在三个纯战略纳什均衡:(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 两个均衡结果:(开发,不开发)(不开发,开发) 注意:均衡不同于均衡结果,到底哪一个均衡结果将最终出现?,子博弈精练纳什均衡,A,开发,不开发,B,B,开发,不开发,开发,(-3,-3),(1,0),(0,1),(0,0),不开发,(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发),如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。

25、子博弈精练纳什均衡结果是:A选择开发,B选择不开发。,x,x,对于(不开发,(开发,开发),这个组合之所以构成纳什均衡,是因为B威胁不论A开发还是不开发,他都将选择开发,A相信了B的威胁,不开发是最优选择,但是A为什么要相信B的威胁呢?毕竟,如果A真开发,B选择开发得-3,不开发得0,所以B的最优选择是不开发。如果A知道B是理性的,A将选择开发,逼迫B选择不开发。自己得1,B得0,即纳什均衡(不开发,(开发,开发)是不可置信的。因为它依赖于B的一个不可置信的威胁。同样: (不开发,不开发)也是一个不可置信威胁,纳什均衡(开发,(不开发,不开发)是不合理的。,子博弈精练纳什均衡,泽尔腾引入子博弈

26、精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析:(1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)

27、。(2)子博弈的信息集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。习惯上,任何博弈的本身称为自身的一个子博弈。,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),不开发,不开发,房地产开发博弈,找出房地产开发博弈的子博弈,(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发),A,开发,不开发,X,X,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),

28、(0,0),参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),子博弈精练纳什均衡:扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果:(1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。,A,开发,不开发,B,B,开发,不开发,开发,(1,0),(0,1),(0,0),(-3,-3),x,x,房地产开发博弈,(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成,完全信息动态博弈-子博弈精练纳什均

29、衡 泽尔腾(1965),不开发,判断下列均衡结果哪个构成子博弈精练纳什均衡?,不开发,b,c,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的;而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),战略是参与人行动规则的完备描述,它要告诉参与人在每一种

30、可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 子博弈精练纳什均衡 扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 三 应用举例,用逆向归纳法求-子博弈精练纳什均衡,1,U,D,L,(3

31、,1),(0,0),2,(2,2),R,给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。,如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),用逆向归纳法求子博弈精练纳什均衡对于有限完美信息博弈,逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法。,完全信息动态博弈-子博

32、弈精练纳什均衡 泽尔腾(1965),1,U,D,L,(1,1),2,2,0,R,U,(3,0),(0,2),1,D,子博弈精练纳什均衡(U,U),L).U和L分别是参与人1和参与人2在非均衡路径上的选择。逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。,完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965),用逆向归纳法求解的子博弈精练纳什均衡也要求“所有的参与人是理性的”是共同知识。如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。,完全信息动态博弈-子博弈精练纳什均衡

33、 泽尔腾(1965),进入者,进入,不进入(0,300),在位者,市场进入阻挠博弈树,不可置信威胁,支付函数,行动,合作(40,50),斗争(-10,0),作业,强盗分赃(向前展望,倒后推理) 有5个强盗抢得100枚硬币,在如何分赃上争论不休,于是他们决定: (1)抽签决定个人的号码(1,2,3,4,5) (2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就通过,否则他被扔进大海喂鲨鱼; (3)1号死后,2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号被扔进大海; (4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩5号,他独吞) 结果会如何?,作业,完全信息

34、动态博弈-子博弈精练纳什均衡 泽尔腾(1965),练习:-作业6 参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如果两人都带伞,下雨时每人效用为-2,不下雨时每人效用为-1;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述: (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策); (2)两人在出门前都不知道是否会下雨,但

35、丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞; (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策; (4),同(3),但妻子先决策,丈夫后决策.,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 子博弈精练纳什均衡 扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 三 应用举例,承诺行动与子博弈精练纳什均衡,承诺行动与子博弈精练纳什均衡有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己

36、的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.这些改变博弈结果而采取的措施称为承诺行动. 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟). 不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.,承诺行动与子博弈精练纳什均衡,曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。,承诺行动与子博弈精练纳什均衡,房地产开发博弈,如果在

37、A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是承诺行动.,(1,-3.5),承诺行动与子博弈精练纳什均衡,经常有这样的情况,非理性-通常是自动的而不是策略性的-是一个优势。在电影怪爱博士中的末日机器就是一个例子。前苏联认为不可能在一场理性的军备竞赛中超过更富有的美国,所以,他制造了一颗炸弹,如果任何人引爆了这颗炸弹,它将自动炸毁整个世界。这部电影描述了这样一个细节,你必须告诉对方你有这么一个末日机器。据说前美国总统尼克松曾告诉他的副手哈德蔓,他对这个策略更复杂的看法:我称为疯子理论,我要让北越相信我已经到了无论付出多少都要结

38、束战争的地步,我们只要他听到这样的传闻:“看在上帝的份上,尼克松已经被共产党搞疯了,当他生气的时候,我们没法制止他,他的手已经按在核按纽上了。”胡志明两天之后会到巴黎求和的。,子博弈精炼纳什均衡-不可置信威胁,美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状

39、不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 多个参与人的情况 蜈蚣博弈 四 重复博弈和无名氏定理 五 应用举例,逆向归纳法与子搏弈精练纳什均衡的存在问题,1,D,(1,

40、1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。,多个参与人的情况,(2,2),逆向归纳法与子搏弈精练纳什均衡的存在问题,如果n很大,结果又如何呢?,1,D,(1,1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,多个参与人的情况,(2,2),对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的

41、支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。这个链越长,共同知识的要求就越难满足。,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题 多个参与人的情况 蜈蚣博弈 四 重复博弈和无名氏定理 五 应用举例,逆向归纳法与子搏弈精练纳什均

42、衡的存在问题,1,D,(1,0),A,2,D,(0,2),A,2,D,(N,0),A,(0,N+1),A,1,D,(0,N-1),A,1,D,(3,0),A,2,D,(0,4),A,每个参与人有多个行动机会的蜈蚣博弈,1、2进行游戏决策,如果1在第一轮决策,得1,2得0,否则进入第二轮,2决策得2,A得0,逆向归纳法与子搏弈精练纳什均衡的存在问题,1,D,(1,1),A?,2,D,(0,3),A,1,D,(98,98),A,2,D,(98,101),A,另一种蜈蚣博弈,(100,100),2,D,(97,100),A,1,D,(99,99),A,有两个参与人1、2,若第一次1决策结束,1、2都

43、得n,若2决策结束,1得n-1,B得n+2,下一轮从1、1都是n+1开始,共100次,每个参与人有100个决策结。,1,D,(2,2),A,2,D,(1,4),A,但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于你的参与人未来的行为。特别是,你如何修正你对参与人理性程度的评价。,逆向归纳法与子搏弈精练纳什均衡的存在问题,逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。 弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。 他们认为,任何一个有关博弈行为的理论应该是“完备的”,即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博弈行为的条件预测总是很好定义的。,第三章 完全信息动态搏弈-子博弈精炼纳什均衡,一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 重复博弈 有限次重复博弈 无限次重复博弈 参与人不固定时的重复博弈 五 应用举例,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经济财会 > 经济学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报