收藏 分享(赏)

博弈(1、 2).ppt

上传人:dreamzhangning 文档编号:3328850 上传时间:2018-10-14 格式:PPT 页数:198 大小:1.12MB
下载 相关 举报
博弈(1、 2).ppt_第1页
第1页 / 共198页
博弈(1、 2).ppt_第2页
第2页 / 共198页
博弈(1、 2).ppt_第3页
第3页 / 共198页
博弈(1、 2).ppt_第4页
第4页 / 共198页
博弈(1、 2).ppt_第5页
第5页 / 共198页
点击查看更多>>
资源描述

1、博弈理论与应用,主讲教师张照贵(统计学院),囚徒困境 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的房子里审讯。警察告诉他们:如果两人都坦白,各判刑3年;如果两个都抵赖,(或因证据不足)各判一年;如果一人坦白一人抵赖,坦白的获释,抵赖的判刑5年。下表给出囚徒困境的战略式表述:Y坦白(y1) 抵赖(y2),坦白(x1) X抵赖(x2),3 ,3 0 ,55 ,0 1 ,1,囚徒困境反映了一个很深刻的问题,就是个人理性与集体理性的矛盾。若两人均抵赖,各判刑一年,但这个帕累托改进办不到,因为它不满足个人理性,不是纳什均衡。,参考书目 博弈论与信息经济学 张维迎 上海三联出版社经济博弈论 谢

2、识予 复旦大学出版社博弈与信息 美 艾里克 . 拉斯缪森 北大出版社博弈论 施锡铨 上海财大出版社 博弈论 法 让. 梯若尔 美 朱. 弗登博格 人大出版社,教材 经济博弈与 应 用 张 照 贵 西南财大出版社,“兵来将挡,水来土掩”“道高一尺,魔高一丈”“管理即动态的斗法”一分钟经理 五十九秒员工 “博弈的本质是悖论的”,第一章 博弈论概况,博弈及博弈论,博弈及博弈论的发展,博弈论与经济学,博弈论的构成要素,博弈论的分类,一、博弈及博弈论 “博弈论” 是译自英文Game Theory。Game是游戏,Game,Theory就是游戏理论。因此,博弈就是游戏的意思,博弈论的英文直译就是“游戏理论

3、” 。 游戏是大家非常熟悉的活动,如下棋、打牌、博彩、田径、球赛等。这些游戏一般有如下一些特征 第一,一般均有两个及以上的参与人。 第二,都有一定的规则。如可以做什么,不能做什么,按什么次序做,什么时候结束及犯规处罚等。 第三,游戏总有一个结果。如一方输,一方赢,平局或参与者各有所得等,且结果一般能用正或负的数量表示。 第四,战略(也称计谋或策略)的不同选择对应不同的游戏结果。战略在游戏中的作用至关重要。战略间有相互依存性,即游戏的每个参加者所得结果好坏,不仅取决于自己战略的选择,同时也取决于其他参加者的战略选择。,人们发现许多经济、政治、军事活动中的决策问题,也与游戏有着基本相似的特征。为了

4、扩大游戏及游戏理论的应用领域,一般将Game译成博弈,而将Game Theory译成博弈论。博弈就是参与人(可能是个人,也可能是团体,如国家、企业、国际组织等)在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或战略中进行选择并加以实施,而取得相应结果(支付函数)的过程。 博弈论就是系统研究具有上述特征的博弈问题,寻求各博弈方合理选择战略情况下博弈的解,并对这些解进行讨论分析的理论。,作为游戏的博弈,应该说自从游戏的产生,就有了博弈的实践活动。如我国战国时代为大家所熟悉的“田忌赛马”。以后进一步扩展到军事领域,从“三国演义”中可以找到很多著名的博弈例子。但将博弈上升到理论阶段,却是在

5、20世纪。20世纪20年代,法国数学家波雷尔用最佳策略的概念研究了下棋和其他一些具体的博弈问题,并试图将其作为应用数学的分支加以系统研究。第二次世界大战期间,博弈的思想及研究方法被运用到军事领域和战时的其他活动之中。如用博弈的方法研究盟军在日本空军敢死队(神风突击队)在各种攻击情况下的应对措施。1944年,约翰.冯.诺依曼(J.von.Neumann)和摩根斯特恩(Morgensten)合著的竞赛论与经济行为被认为是系统研究博弈理论的开端。,二、博弈及博弈论的发展,20世纪50至80年代,被认为是博弈论巨人产生的年代。50年代,纳什(Nash)定义了“囚徒困境”并提出“纳什均衡” ,奠定了非合

6、作博弈的基石。60年代,泽尔腾(Selten)(1965年)将纳什均衡的概念引入动态博弈,提出“精炼纳什均衡”概念。海萨尼(Harsanyi)(19671968年)则把不完全信息引入博弈论的研究,提出“贝叶斯纳什均衡”。到80年代,克瑞普斯(Kreps)和威尔逊(Wilson)等将不完全信息引入动态博弈中,提出了“精炼贝叶斯纳什均衡”。但在20世纪70年代中期之前,博弈论主要还是作为数学的一个分支。博弈论真正得到重视并成为主流经济学的一部分不过是最近一二十年的事。现在,博弈论正在得到经济学科的接受和运用,贯穿了几乎整个微观经济学,并且已扩展到宏观经济学,产业组织理论,在环境,劳动,福利经济学等

7、方面的研究中也占有重要地位,大有“吞噬”整个西方现代经济理论的趋势。,三、博弈论与经济学,(一)从新古典经济学到主流经济学博弈论用于研究经济中的决策问题时,一般称为经济博弈论。新古典经济学认为,经济学是研究面对人的无限欲望与有限资源,如何有效配置这些稀缺资源。经济学中的理性人(即面临给定条件下最大化自己偏好的人)在最大化自己的偏好时,需要相互合作,而合作中又存在冲突。为了实现合作的潜在利益和有效的解决合作中的冲突,理性人发明了各种各样的制度来规范人们的行为。价格制度(又称市场制度)就是人们为达到合作和解决冲突而发明的一种最重要的制度。传统的新古典经济学就是以价格制度为研究对象的,故又称为价格理

8、论。新古典经济学有两个基本假定(1)市场参与者的人数足够多,从而市场是完全竞争的,(2)参与人之间的信息是对称的。但这两个假设在现实中一般是不满足的。,首先,在现实中,买卖双方的人数往往是非常有限的,这时的市场不可能是完全竞争的。在不完全竞争的市场上,人们之间的行为不是相互独立的,而是相互影响的。因此,一个人在决策时必须考虑对方的决策,这正是博弈论要研究的问题。其次,在现实市场中参与者的信息一般是不对称的,如卖者对商品质量的了解通常比买者多。当参与人之间的信息不对称时,任何一种有效的制度安排必须满足“激励相容” 的条件。而这正是不完全信息博弈研究的内容。而且,不完全信息使得价格制度常常不是实现

9、合作和解决冲突最有效的制度安排。如学校、家庭、政府、企业等的一些决策问题,用非价格制度来解决冲突也许更为有效。非价格制度最显著的特征是参与人之间行为的相互作用。而博弈论最鲜明的特点正是研究理性人如何在给定的约束条件下选择行动及行动间的相互作用的。,因此,当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,即当主流经济学取代新古典经济学而占据经济学的主导地位时,主流经济学家认为经济学的研究对象主要是研究人的行为及行为间的相互影响及相互作用时,博弈论逐渐成为经济学的基石。从这个意义上讲,不掌握博弈论的一些基本知识,就不能很好的理解经济学。 (二)经济学发展的几个趋势博弈论成为主流经济

10、学的基石,反映了经济学发展的几个趋势1、经济学研究的对象越来越转向个体。放弃了一些没有微观基础的假定,如消费函数、投资函数、销售最大化等。一切从个人效用函数及其约束条件开始,解约束条件下的个人效用最大化问题而导出行为及均衡结果。而这正是博弈论研究的模式给出个人的支付函数及战略空间,然后看当每个人都选择最优战略以最大化个人支付函数时将发生什么。,2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。过去经济学研究个人行为时,是假定其他人的行为都被总结在一个非人格化的参数 价格里,人们行为之间的相互作用是通过价格来间接完成的。但现在

11、经济学开始转向对人与人之间的直接关系的研究。并注意到个人理性可能导致集体非理性,而传统经济学认为价格可以使个人理性和集体理性达到一致。3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。而博弈论成为主流经济学的一部分,正是伴随着经济学对信息的重视而来的。从某种意义上说,信息经济学是博弈论应用的一部分,或者说信息经济学是非对称信息博弈论。,(三)博弈论与经济学的关系严格地讲,博弈论并不是经济学的一个分支,许多人把它看成是数学的一个分支。如纳什在1951年发表的关于博弈论的奠基性文章就是发表在数学杂志上,而不是在经济学杂志上。但从1994年经济学诺贝尔奖授给纳什,泽尔腾和

12、海萨尼三位博弈论专家后,博弈论被当成经济学的一部份,并成为主流经济学的基石。其原因是 1、博弈论在经济学中的应用最广泛、最成功。博弈论的许多成果是借助于经济学的例子发展起来的,如市场阻挠。2、经济学家对博弈论的贡献越来越大。将动态分析和不完全信息引入博弈论的就是经济学家的功劳。如1982年克瑞普斯 (Kreps)和威尔逊(Wilson)等4人建立的有关信誉问题的著名的“四人帮模型” 。克瑞普斯和威尔逊都是经济学家。,3、经济学和博弈论研究的模式是一样的。这是最根本的原因,经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。博弈论在西方经济学的地位可以从国外流行的经济学教科书的内容

13、的变化中体现出来。,四、博弈论的构成要素 我们用一个例子来说明博弈论的构成要素。 有一房地产开发商A,正考虑在某地段开发一栋写字楼。面临的选择是开发或不开发,若开发,需投入5千万资金;若不开发,投入资金为零。其竞争对手开发商B也面临同样的选择。如果市场上有两栋楼出售,需求大时,每栋售价7千万;需求小时,每栋售价4千万。如果市场上只有一栋楼出售,需求大时,售价9千万;需求小时,售价6千万。这样,可能出现以下8种可能情况,1、 需求大,A开发,B不开发,A的利润为4千万,B的利润为零;2、 需求大,A不开发,B开发,A的利润为零,B的利 润为4千万;3、需求大,A开发,B也开发,各获利2千万; 4

14、、需求大,A不开发,B也不开发,双方利润为零;5、 需求小,A开发,B不开发,A获利1千万,B的利润为零;6、需求小,A不开发,B开发,A的利润为零,B获利1千万;7、 需求小,A开发,B也开发,双方各亏1千万;8、 需求小,A不开发,B也不开发,双方利润为零。,(一)参与人 1、参与人的概念参与人是指一个博弈中独立决策,独自承担博弈结果的决策者,也称博弈方或局中人。参与人可以是个人,也可能是团体(如国家、企业、国际组织等)。一般用ni表示,i=1,2,3,. . .,n。房地产开发博弈中有两个参与人,开发商A和B。,2、根据参与人多少的博弈分类 由于博弈中的战略具有依存性,故博弈中的参与人多

15、少非常重要。一般而言,参与人越少,问题越简单,参与人越多,则问题越复杂难解。(1) 单人搏弈只有一个参与人的博弈称为单人博弈。严格来说,单人博弈已退化为一般的最优化问题,而不是博弈问题。但单人博弈是双人、多人博弈的基础。对单人博弈而言,参与人获得的信息越多,决策的正确性越高,得益越多。这是单人博弈与双人、多人博弈的根本区别之一。,(2)双人博弈有且只有两个参与人的博弈,称为双人博弈。这是最普遍,也是研究最多的博弈类型。双人博弈有如下一些特点两参与人之间的关系并不总是相互对抗的,有时会出现利益一致的情况;信息多的一方不能保证得益也较多;个人理性并不一定导致集体理性。,(3)多人博弈参与人为3人及

16、以上的博弈,称为多人博弈。其性质与特征与双人博弈基本相同,但战略相互依存关系更为复杂。与双人博弈的一个本质区别是可能产生“损人不利已” 的破坏者。若有破坏者时,使多人博弈的结果难以确定,因为破坏者的行为难于用逻辑推理或经济规律耒判断,这是在多人博弈中特别需要注意的。,(二)行动 1、 概念行动是参与人在某个时点的决策变量。一般用ai表示第i个参与人的特定行动。Ai=ai表示可供i选择的行动集合。在上例中,每个参与人只有两种行动可供选择,即Ai=开发,不开发。n个参与人的行动的有序集合a=(a1,a2,. . . ,an)称为行动组合。在上例中,若A选择不开发,B选择开发,则(不开发,开发)是一

17、个行动组合。该例中共有4个行动组合。,2、行动的顺序行动的顺序对博弈的结果至关重要。有关静态博弈与动态博弈的划分就是依据行动的顺序而进行的。静态博弈是指参与人同时选择行动的博弈。动态博弈是指参与人不同时选择行动的博弈。“同时” 是一个信息概念,而不是一个时间概念。在房地产开发博弈中,如A先选择开发,但B后选择时并不知道A的选择是什么,则是静态博弈;但B后行动时知道了A的选择,则是动态博弈。,(三)信息 1、 信息的概念知己知彼,百战不殆。信息在博弈中有非常重要的作用。信息是参与人有关博弈的知识。特别是有关博弈的得益,“自然” (虚拟参与人)的选择,其他参与人的特征和行动的知识。 2、信息集信息

18、集是描述参与人信息特征的一个概念(准确的概念后面给出),这里可理解为参与人在特定时刻有关变量的值的知识。如在房地产开发中,如果A不知道市场需求是大还是小,而B知道,则A的信息集为(大,小),B的信息集为(大)或(小);又假定B先行动A后行动,如果A在行动前准确知道B选择了什么行动,则A(有关B的行动)的信息集为开发或不开发 ,反之,A的信息集为开发,不开发 。,3、完全信息与不完全信息博弈中最重要的信息之一是关于得益的信息,即每个参与人在每种战略组合下的得益情况。如上例中的8种可能情况下A、B的收益。如果参与人完全了解所有参与人各种情况下的得益(支付函数),称此参与人具有完全信息。如果参与人不

19、完全了解其他参与人的得益,则该参与人具有不完全信息。所有参与人均具有完全信息的博弈,称为完全信息博弈。至少有一个参与人具有不完全信息的博弈,称为不完全信息博弈。,4、完美信息与不完美信息在动态博弈中,若参与人完全了解自己行动之前的整个博弈过程,称此参与人具有完美信息(完美回忆)。若参与人不完全了解自己行动之前的整个博弈过程,则该参与人具有不完美信息。所有参与人都具有完美信息的博弈,称为完美信息博弈。至少有一个参与人具有不完美信息的博弈,称为不完美信息博弈。如打牌时,打了几轮牌后,当轮到某一个牌手出牌时,记不清前几轮出了些什么牌了,该牌手则具有不完美信息。,5、完全信息与完美信息的关系首先,完全

20、与不完全信息是按参与人有关得益的信息来划分的。完美与不完美信息是按参与人有关博弈过程的信息来划分的,且在动态博弈中才进行这种划分。其次,不完全信息意味着不完美信息,但逆定理不成立。在房地产开发中,如果至少有一个参与人不知道各种可能情况下的得益,则信息是不完全的,也是不完美的。如果两开发商若均知道各种情况下的得益,则信息是完全的,若A后行动,B先行动,但A不知道B的选择,则信息是不完美的。,6、共同知识“共同知识”是与信息有关的一个重要概念。,博弈专家们发现在博弈中存在着共同知识的问题。让我们来看一下什么是共同知识。要弄清什么是共同知识, 首先要弄清什么是知识。所谓知识是人对真的信念。知识是人们

21、对自然中某个事实的认识, 我们说某人拥有某种知识,意指某人知道某个事实。地球绕着太阳转 是个事实, 但哥白尼之前的人们并不知道这个事实, 而今天这个事实已几乎被所有人熟知, 并且人们相信这个事实,于是“地球绕着太阳转”构成人们的知识。因此知识涉及三个因素; 1) 人们了解的事实对象要是真的, 假的事实不能成为知识。人们可能相信虚假的东西,但它们不能构成相信它们的人的知识。,在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当然只是错误的信念 而不是知识。再比如:在古代 中国人认为雷电是由掌管雷电的雷公行云布雨的结果, 这当然也不是真的事实。假的

22、信念有时对信念拥有者有一定的效果,但不构成相信者的知识。2)某个人要知道这个真的事实。许多存在着的真的事实我们并不知道,它们并不能构成我们(人类)的知识。我们常说知识如大海一样, 我们知道的只是知识海洋中的一滴水。我们不知道的东西太多了。,3)人们要相信他所知道的事实。如果他不相信某些事实,尽管他知道,也不构成他的知识。哥白尼提出地球围绕太阳转的日心说观点,那时许多人知道了这个事实,但并不相信,因此“日心说” 就不能构成他们的知识。逻辑学家研究人的“知道” 的结构, 他们发现 当某人知道某个事实时, 这意味着:他知道他知道该事实, 他知道他知道他知道该事实,这是一个无穷的过程。将这个结构推广到

23、某一人群就构成共同知识的概念。共同知识这个概念最初由逻辑学家刘易斯提出,之后由经济学家阿曼等用于博弈分析。共同知识是一个群体人们之间的对某个事实“知道” 的关系。,假定一个人群由A、B两个人构成,A、B均知道一件事实,f是A、B的知识, 但此时还不是他们的共同知识。当A、B双方 均知道对方知道f,并且他们各自都知道对方知道自己知道f , 此时我们说,f成了A、B间的共同知识。这个人群是由两个人组成 ,如果由多人组成,这不仅指任意 两个人这样一个双方“知道”的过程,而且指 其中任何一个人 知道其他人知道其他人知道事实f。因此 共同知识涉及一群体的对某个事实“知道的结构。,帽子的颜色?有一群人围坐

24、在一起,为了便于分析,假定只有4人(这与 人数多少无关,可作同样分析)。每个人头戴一顶帽子, 帽子为 红色和白色两种,每个人看不到自己帽子的颜色 但能看到别人 帽子的颜色。因此此时他不能判定出自己头上的帽子的颜色。为了分析的方便, 我们假定这4个人均戴的是红色的帽子。 这时候,一个局外人来到他们的群体当中,对他们说:“你们其 中至少一位戴的是红色的帽子”。当他说了这句话后,他问: “你们知道你们头上的帽子的颜色吗?”4个人都说 “不知道”:这 个局外人第二次问:“你们知道你们头上的帽子的颜色吗?”4个 人又都说“不知道”。局外人第三次问:“你们知道你们头上的帽子的颜色吗?” 4个人又说“不知道

25、”。局外人又问第四次:“你们 知道你们头上的帽子的颜色吗?”这时4个人均说: “知道了”你能知道为什么吗?,当局外人未宣布“至少一个人戴的是红帽子”时,这个事实其实每个人都知道了,因为每个人看到其他3个人的帽子都是红 色的,但每个人不知道其他人是否知道这个事实,即这个事实没有成为共同知识。而当这个局外人宣布了之后, “至少一个人的帽子是红色的” 便成了公共知识。此时不仅每个人知道”至少一个人的帽子是红色的” ,每个人还知道其他人知道他知道这个事实。局外人第一次问时,由于每个人面对的其他3个人都是红色 的帽子,每个人当然不能肯定自己头上的帽子是什么颜色,于是均回答 “不知道” 。此时,如果只有1

26、个人戴红色的帽子 那么 这个人因面对3个戴白色的帽子,他肯定知道自己的帽子颜色。 因此,当4个人均回答“不知道” 时,意味着“至少有2人戴的是 红色的帽子”,而且这也是共同知识。,当局外人第二次问时, 如果只有2人戴的是红色的帽子 这2人就会回答说“知道”因为他们各自面对的是1个戴红色帽子的人。由于每个人面对的是不止一个戴红色帽子的人,因此当局外人第二次问时,他们只能回答“不知道” 。此时的“不知道”,意味着“至少3个人戴红色的帽子” ,并且它成为共同知识。,同样,局外人第三次问时,他们均回答 不知道,意味着4 个人均戴的是红色的帽子。因此 当局外人第四次问时 他们就 知道宣布每个人头上均戴的

27、是红色的帽子,于是 他们回答“知 道” 。在这个过程中,当局外人首先宣布“其中至少一个人的帽子 是红色的”以及第二、第三、第四次回答的时候,无论是回答 “知道” 还是 “不知道”它们构成共同知识构成所有人 推理的前提, 在这个过程中 每个人均在推理。,共同知识是指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道. . . . . . ”的知识。“共同知识”是博弈论中一个非常强的假设。在房地产开发中,一种可能的情况是,A和B都知道市场的需求,但A并不知道B知道市场需求;或者是,即使A知道B知道市场需求,B可能并不知道A知道B知道市场需求。则这时市场需求不

28、是A、B的“共同知识” 。,(四)战略1、 概念战略是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动,也称策略。一般用si 表示第i个参与人的一个特定的战略。用Si=si代表第i个参与人所有可选择的战略集合。在n人博弈中,n维向量S=(s1,s2 ,. . . ,sn)称为一个战略组合。,在房地产开发中,如果B在不知道市场需求的情况下先行动,A在知道B的行动后再选择自己的行动。则B有两个战略B=开发,不开发;A有4个战略(开发,开发开发,不开发不开发,开发不开发,不开发)。战略集合x,y内的第一个元素对应B选择开发时A的行动,第二个元素对应B选择不开发时A的行动。本例中

29、有8个战略组合如S=(不开发,开发开发)是一个战略组合,意味着A的战略是“如果B开发,我不开发;如果B不开发,我开发” ,B的战略是开发。读者可写出其它7个战略组合。,2、战略与行动的关系 首先,战略与行动是两个不同的概念,战略是行动的规则,而不是行动的本身。如“人不犯我,我不犯人;人若犯我,我必犯人” 是一个战略,“犯” 与“不犯” 是两种行动,战略规定什么时候选“犯” ,什么时候选“不犯” 。 其次,作为参与人的行动规则,战略依赖于参与人获得的信息。但在静态博弈中,所有参与人同时行动,没有任何人能获得他人行动的信息,故战略与行动是一回事。这时的战略选择就变成简单的行动选择。但在动态博弈中则

30、是两个不同的概念。,3、战略必须是完备的作为一种行动的规则,在制定战略时,必须给出参与人在每一种可能情况下的行动选择,即使参与人清楚这种情况实际上并不会发生。如在房地产开发中,如果A、B都知道市场需求是大的,A在B之后行动。A的战略不仅要给出B选择“开发” 时,A如何选择,还必须给出B选择“不开发” 时,A应当如何选择,即使A确信B会选择“开发” ,而不会选择“不开发” 。因为一种特定情况是否真的会发生,往往依赖于参与人的战略。这一点对于动态博弈的均衡是非常重要的。,(五)得益 1、概念得益(或支付)是指在一个特定的战略组合下参与人所获得的利益。它是博弈中参与人追求的主要目标,也是行动和战略选

31、择的依据。得益可以是确定的收益,也可以用效用水平或期望效用水平来表示。得益常需要用数量来表示,可正,可负。在房地产开发中,参与人的利润就是他们的得益,具体数量见前面的例子。,1、 2、按得益之和的博弈分类 1)零和博弈一方的收益必为另一方的损失,其支付之和为零的博弈。许多游戏均为零和博弈。零和博弈由于参与方的利益总是相对抗的,具有你死我活的关系;即使重复若干次,也无法改变相互对抗的关系,一般不会产生合作博弈;且结果总是不能完全确定。,2)常和博弈得益之和不为零,但为一非零常数(或正或负)的博弈。 参与人之间的基本关系仍然是对立的,但不一定会产生输家,利益的对抗性有时体现在利益的多少上(如遗产分

32、配),可能产生妥协或合作;在重复博弈中,可能创造出许多新结果,如使总得益增加,达到双赢结果。3)变和博弈得益之和不为零,且不同战略组合下的得益之和也各不相同的博弈。这是最一般的博弈,也是研究最多的博弈类型。,(六)均衡 1、概念均衡是所有参与人的最优战略组合,一般记为S*=(s1*, . . . ,si* ,s*n )。Si* 表示第i个参与人在均衡情况下的最优战略。博弈分析的目的就是预测博弈的均衡及均衡结果,均衡也就是博弈的解。在不同的博弈中,有各种各样的均衡概念,上述均衡概念描述了所有均衡的共同特征。 2、均 衡的不唯一性 正如许多数学题有多个解一样,一个博弈也可能有多个均衡存在。在房地产

33、开发中,若A、B同时行动,在需求大时,(开发,开发)是唯一的均衡;但在需求小时, (开发,不开发)是一个均衡,(不开发,开发)也是一个均衡。,3、均衡与均衡结果这是两个非常容易混淆的概念。一般讲“均衡”常指的是“均衡结果” 。许多情况下,二者的区别并不重要,但理解二者的区别对理解博弈的理论很重要,特别是在动态博弈中。在房地产开发中,若B先选择,A后选择,需求小时,B的最优战略是“开发”,A的最优战略是“如果B开发,我不开发;如果B不开发,我开发” 。均衡是 (不开发,开发 ,开发),而均衡结果是(不开发,开发),即B开发,A不开发。这里不开发是均衡情况下A的最优行动,而非A的最优战略本身。,怎

34、样来描述一个博弈?描述一个博弈至少必须包括参与人,战略,支付。而行动与信息则是建筑材料。参与人,行动的结果合起来称为博弈规则,建模者目的在于运用博弈的规则来确定均衡。,五、博弈的分类 一般将参与人行动的顺序和信息二者结合进行分类完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈,第二章 完全信息静态博弈二人零和博弈纯战略混合战略二人非零和博弈纯战略纳计均衡混合战略纳计均衡纳什均衡的存在性及多重性应用领域,第一节 二人零和博弈 一、二人零和博弈的特点有且只有两个参与人;一方的收益必为另一方的损失;非合作博弈;双方具有完全信息;双方同时行动,二、有纯战略的二人零和博弈 例1夫妻露

35、营博弈有一对夫妻到一旅游地露宿,男的希望住在最高的地方,女的希望住在最低的地方。该地东西向与南北向各有4条道路,他们约定,男的在东西向的路中选一条,女的在南北向的路上选一条,然后在道路的交叉处住宿。他们各自会选中哪一条路呢?4条道路交叉处的海拔高度如下表,女Y1 Y2 Y3 Y4X1 6 1 5 1 男 X2 1 2 3 4X3 4 3 5 5X4 4 2 1 6,行的最小值1131,列最大值 6 3 5 6,纯战略的寻找在得益矩阵中,若存在每行的最小值中的最大值等于每列最大值中的最小值,该值对应的战略称为纯战略。该值也称为鞍点。,单位千英尺,是什么原因迫使理性参与人在最大化自己的利益时,必须

36、考虑其他参与人的利益?,他们能否自觉自愿的遵守自己的选择?,(一)纯战略在一个博弈中,参与人均有唯一的最优战略,在重复博弈中,参与人的最优行动就是连续不变地使用他的最优战略,这样的战略称为纯战略。在零和博弈中,当行最小值的最大值等于列最大值的最小值时,可判断该博弈存在纯战略,又称为博弈的极小极大解(鞍点)。极小极大解表明各参与人安全水准的最大限度,即他们应在X3、Y2的交叉点上露宿,没有其它的战略能提供这种程度的安全水准。,(二)博弈值在同一博弈中,大量重复博弈的平均得益值。在零和的纯战略博弈中,鞍点值就是博弈值。博弈值可用于分析博弈结果对某个参与人是否有利还是不利。,例2、广告策略博弈某街道

37、有A、B两汽修厂,其市场占有率分别为55%和45%。某电视台向A汽修厂经理劳尔福推荐了三套广告方案,每一种方案均可从B厂争取到一部份顾客。但A厂经理非常清楚,该电视台会将同样的广告方案向B厂推荐。据有经验的市场人员估计,双方采用三套广告方案的支付矩阵如下,B 单位%Y1 Y2 Y3 行最小值X1 3 - 4 1 - 4 A X2 - 3 0 1 - 3X3 4 3 2 2 列最大值 4 3 2,在零和博弈中,一方的得是另一方的失,故在支付矩阵中,可只用一个数值表示,一般是根据A的得益来编制的。在上例中,A和B均采用第一套广告方案,则A厂可从B厂争取到3%的市场份额,意味着B厂将失去3%的市场份

38、额。其余同此理。 该博弈有纯战略(X3, Y3)。,三、有混合策略的二人零和博弈(2*2) 例3、手心与手背的游戏YY1 (手心) Y2(手背) 行最小值X1(手心) 1 - 1 - 1 XX2(手背) - 1 1 - 1列最大值 1 1,可见该博弈没有纯战略。,(一)混合战略1、混合战略的概念如果一个战略规定参与人在给定的信息条件下,以某种概率分布随机的选择不同的行动,称这样的战略为混合战略。,2、确定混合战略的原则1)自己的战略不能预先让对方猜中;2)选择每种战略的概率一定要恰好使对方无机可乘。3、概率的计算,上例中,若令X出手心的概率为P(X1),出手背的概率为P(X2);令Y出手心的概

39、率为P(Y1),出手背的概率为P(Y2)。则有 P(X1)(- 1) P(X2)1 P(X1)1 P(X2)(- 1)解之, P(X1) P(X2)因为, P(X1) P(X2)1 得 P(X1)0.5 P(X2)0.5同理可得 P(Y1)0.5 P(Y2)0.5可见,两参与人分别以50的概率出手心和手背。,4、混合战略的博弈值G0.50.510.50.5-10.50.510.50.5-10,博弈值的含义及作用?,YY1 (手心) Y2(手背) 大减小 互换X1(手心) 1 - 1 2 2 XX2(手背) - 1 1 2 2 大减小 2 2互换 2 2 4,P(X1)=2/4=0.5 P(X2

40、)=2/4=0.5 P(Y1)=2/4=0.5 P(Y2)=2/4=0.5,5、22零和博弈混合战略的简捷算法,例2、福尔摩斯的头几乎被砍掉一半为逃脱莫里阿蒂教授的追踪,福尔摩斯准备从伦敦的维多利亚港乘火车到多维尔港而转赴欧洲,中途有一站叫坎特布雷。火车开动时,福尔摩斯发现了莫里阿蒂,他相信莫里阿蒂会用专列来追赶他,若二人碰面,福尔摩斯必死无疑。福尔摩斯应在什么地方下车才能逃脱莫里阿蒂教授的追踪。,福Y 1(多) Y2(坎) 大减小 互换X1(多) 100 0 100 150 莫X2 (坎) - 50 100 150 100大减小 150 100互换 100 150 250,P(X1)=150

41、 / 250 = 0.6 P(X2)= 100 / 250 =0.4 P(Y1)= 100 /250 = 0.4 P(Y2)= 150 /250 = 0.6,G = 0.40.61000.40.4500.60.600.60.4100=40,6、可化简为22的零和博弈的混合战略求解,YY1 Y2 Y3X1 0 - 4 0X X2 - 2 4 0X3 - 1 - 5 - 2,该博弈不存在纯战略。用剔除劣战略的方法,对X而言,X3劣于X1 ,故X3被剔除;,在剩下的博弈中,对Y而言Y3劣于Y1 ,故Y3被剔除。,在化简为22的博弈中,用简捷法可求得,P(X1)0.6 P(X2)0.4 P(Y1)0.

42、8 P(Y2)0.2,第二节 二人非零和搏弈 一、有纯战略的非零和博弈(一)纳什均衡纳什均衡的直观意义是在n人参与的博弈中,给定其他参与人战略的条件下,每个参与人选择自己的最优战略,所有参与人选择的战略构成一个战略组合。所有参与人的最优战略构成的战略组合,称为纳什均衡。纳什均衡是完全信息静态博弈的解。,纳什均衡的哲学意义假设博弈中的所有参与人事前达成一项协议,规定每个人的行为规则。问题在于,在没有外来强有力的约束时,参与人是否会完全自觉自愿的遵守这个协议?,若参与人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡即给定别人遵守协议的情况下,没有人有积极性不遵守这个协议。反之,如果至少有一个参

43、与人会违背这个协议,则这个协议不构成纳什均衡,不满足纳什均衡的协议是没有意义的。,寻找纳什均衡的一种方法是划线法。,(二)几个典型的博弈例子,1、 囚徒困境 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的房子里审讯。警察告诉他们:如果两人都坦白,各判刑3年;如果两个都抵赖,(或因证据不足)各判一年;如果一人坦白一人抵赖,坦白的获释,抵赖的判刑5年。下表给出囚徒困境的战略式表述:Y坦白(y1) 抵赖(y2),坦白(x1) X抵赖(x2),3 ,3 0 ,55 ,0 1 ,1,囚徒困境反映了一个很深刻的问题,就是个人理性与集体理性的矛盾。若两人均抵赖,各判刑一年,但这个帕累托改进办不到,

44、因为它不满足个人理性,不是纳什均衡。,重要结论一种制度的安排,要发生效力,必须是一种纳什均衡,否则,这种制度安排便不能成立。,应用寡头企业选择产量的博弈(寡头竞争模型);价格竞争模型;公共产品的供给 ;公共资源的利用;基础设施的投资;军备竞赛;经济改革等等,现实中,有许多类似于囚徒困境的似乎不合理的现象可以用博弈论的思维得到合理的解释。如某些公共产品的供给类似于囚徒困境,楼道的路灯坏了多时没人更换,而室内却灯火明亮,如果及时更换路灯,大家都不会摸黑走路。问题是,如果我出钱换路灯,我得不偿失,而如果你出钱换路灯,我就会占便宜。因此,每个理性参与人的最优选择是“不更换”,这种纳什均衡的结果是大家都

45、摸黑走路。类似于囚徒困境的公共产品会趋于供给不足。,与类似于囚徒困境的公共产品供给不足的情况相反,某些没有排他性所有权的公共资源会倾向于使用过度。如近几年中国北方的沙尘暴现象引起了人们极大的担扰。据统计,离北京最近的沙漠只有60公里,且中国沙漠化的速度还呈上升趋势,20世纪50年代至70年代中期,沙漠区年均扩大1560平方公里,20世纪70年代中期至80年代中期,沙漠区年均扩大2100平方公里,而目前沙漠区年均扩大2460平方公里。而沙漠化的原因是人们对土地的“滥垦”、“滥牧”、“滥伐”、“滥采”。如对牧区的一份调查显示,草原上牲畜严重超载现象十分严重,牧区一般超载50%至120%,有的牧区超

46、载达300%。问题是,当公共资源没有排他性所有权,而牧民又独自进行选择时,理性的单个牧民会想,我“多养”几只牛羊不会对草原造成多大的影响,而“少养”则自己吃亏,每个牧民的最优选择是“多养”,因此草原被“滥牧”了。这也是典型的囚徒困境。,再如,几家生产相同产品的寡头竞争企业,几经“价格战”的折磨已使得大家都几乎无利可图,这些企业当然都知道“物以稀为贵”的市场原理,如果他们能联合起来,采取“限量稳价”的战略,虽然每家企业的产量少了,却都可以获得更多的利润。但是,给定别的企业“限量”的情况下,自己却有“不限量”的冲动,因为这时多生产的产品可以以一个较高的价格售出,“不限量”将使自己获益。所有理性的企

47、业都这样想,“不限量”是他们的最优选择,新一轮的“价格战”重新开始,这些企业的利润进一步减少,有些企业更会遭到“破产”的灭顶之灾。囚徒困境的“困境”是乎与他们形影不离。前几年中国几家彩电巨头的“价格联盟”的流产,除了有垄断之嫌外,“价格联盟”不是纳什均衡协议也是流产的重要原因。个人理性再一次与集体理性相矛盾,对这些企业当然是十足的坏事,价格战会再次打下去,消费者当然只好偷着乐了。,还有,在冷战时期美、苏两国的军备竞赛也是典型的囚徒困境。爱好和平的人会想,他们花费巨额军费生产出来的武器是否真的会派上用场,可能大多数武器最后难逃被销毁的命运,但他们为什么还会争相增加军费来扩大军备呢?博弈论认为,在一个弱肉强食的世界,如果一方扩军备战,另一方就会感到自己的安全受到威胁,因此,双方的最优选择都是“增加军费”,军备竞赛就这样被“激励”起来。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报