1、微 观 经 济 学,主讲人:韩松,第十章 博弈论初步,封二,第十章 博弈论初步 知识结构,知识结构,不完全信息,动态博弈,博弈论,基本要素,纯策略均衡,混合策略均衡,完全信息,静态博弈,博弈树,逆向归纳法,条件策略,纳什均衡,囚徒困境,下划线法,支付矩阵,第一节 博弈论和策略行为 一、博弈的定义,第一节 博弈论和策略行为,厂商之间的行为是相互影响的,这种相互作用的关系就如同赌博下棋(博弈)一样。 博弈论 (Game Theory) 是研究在策略性环境中如何策略性地进行决定和采取行动的科学。 1944 年, 冯诺依曼和摩根斯顿共著博弈论与经济行为,将博弈论用于经济领域。 博弈论在政治学、计算机科
2、学、国际关系、军 事战略、生物学等领域有广泛的应用。,一 博弈的定义,资料 会下棋的机器,1769 年, 匈牙利工程师巴朗 沃尔夫冈 凡 坎比 林为奥地利皇后做了一台 会 “下” 象棋的机器。 阿伦图灵的“纸上机器”。 贝尔实验室 克劳迪 申朗的“A策略”和“B策略”。 1950年 , 约翰冯诺依曼( John von Neumann )设计出 “MANIAC一号” 。,资料 会下棋的机器,脑力争夺、利益平衡、人生选择 各份戏码精彩纷呈,显现价值取舍的智慧。,视频 智能的较量,视频 智能的较量,第一节 博弈论和策略行为 二、基本的要素,第一节 博弈论和策略行为,策略性决策和行动是指每个人要根据
3、其他人的可能反应来决定自己的决策行动,博弈论显然是分析寡头厂商行为的一个恰当工具。 参与者:进行决策的个体,至少有两个,有时 和可以引入一个虚拟的参与人如“自然”; 策略:是一项规则,一组可选择的行动集合; 支付:各自的报酬,所得到的支付都是所有策 略共同作用的结果支付组合。,二 基本的要素,第一节 博弈论和策略行为 三、博弈的类型,第一节 博弈论和策略行为,从要素可以进行一些博弈分类,如两人博弈和多人博弈、零和博弈和非零和博弈、有限博弈和无限博弈、同时博弈和动态博弈。 从20世纪80年代起,博弈论逐渐成为主流经济学的一部分,转向对人们之间关系的研究。 经济学越来越重视对信息的研究,特别是信息
4、不对称对于个人选择、制度安排的影响,信息经济学与博弈论的应用相互渗透。,三 博弈的类型,合作博弈与非合作博弈:能否达成有约束力协议; 重复博弈与非重复博弈:具有连续性的特点; 零和博弈与非零和博弈:你的所失正是我的所得。,资料 博弈的类型,资料 博弈的类型,第二节 纯策略均衡 一、寡头博弈和支付矩阵,第二节 纯策略均衡,假定在某个寡头市场上,有甲、乙两个厂商。 这一个只有两方参加 并且同时进行决策的 简单博弈。 用一个以二元数组为 元素的矩阵 ( 称博弈 矩阵或支付矩阵 ) 来 描述和分析。,一 寡头博弈和支付矩阵,5,1,2,3,5,6,1,7,甲 厂 商,合作不 合 作,乙厂商,合 作 不
5、合作,第二节 纯策略均衡 二、条件策略和策略组合,第二节 纯策略均衡,把甲厂商在乙厂商选择合作条件下的最优策略 ( 不合作 )叫做甲厂商 的条件优势策略,与 这一条件策略相联系 的策略组合叫条件优 势策略组合。 条件策略包括参与人 的条件策略及组合。,二 条件策略和策略组合,5,1,2,3,5,6,1,7,甲 厂 商,合作不 合 作,乙厂商,合 作 不合作,第二节 纯策略均衡 三、纳什均衡和下划线法,第二节 纯策略均衡,当厂商的条件策略组合恰好相同,从而都不再有单独改变策略的倾向时,整个博弈就达到了均衡,是博弈的解,称为纳什均衡。 纳什均衡指的是参与者在该策略组合上,任何单独改变策略都不会得到
6、好处;当所有其他者都不改变策略时,没有人会改变自己的策略。 假定支付不变时,由于存在成本和风险,参与者也不愿意单独地改变策略。,三 纳什均衡和下划线法,资料 约翰纳什,1994年与泽尔腾、海萨尼分享了诺贝尔经济学奖。 他说自己只做了两件事:一是研究过讨价还价的问题;二是关注了经济问题并从数学角度加以分析。 理性决策决不会无缘无故地损害自身的利益,也就是一个人肯定不会故意做出对自己不利的事。,资料 约翰纳什,孔 明,曹操,小道 大路,小 道大 路,擒住,被擒,逃脱,空等,擒住,被擒,逃脱,空等,案例“华容道”里的纳什均衡(1),案例 “华容道”里的纳什均衡(1),孔 明,曹操,小道 大路,小 道
7、大 路,擒住,被擒,逃脱,空等,擒住,被擒,逃脱,空等,案例 “华容道”里的纳什均衡(1),孔明曰:“亮夜观乾象,操贼未合身亡。留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”,案例“华容道”里的纳什均衡(2),案例 “华容道”里的纳什均衡(2),刘 备,孙权,联合 反目,放 走捉 拿,12,10,-15,-5,-20,20,1,5,刘备军事集团参与赤壁之战有三个战略目标: 首先,必须联合孙权打败曹操,从而为自己赢得生存的时间与空间; 其次,又不能让曹操一方消失,曹操的存在使刘备的存在具有价值; 最后,还要争取在混乱中尽可能地多捞私利。,按键 等待,按 键等 待,1,5,
8、9,-1,0,0,4,4,小 猪,大猪,案例 孙刘联合的“智猪博弈”,案例 孙刘联合的“智猪博弈”,孔明笑曰: “亮借一帆风,直至江东,凭三寸不烂之舌,说南北两军互相吞并。若南军胜,共诛 曹操 以取荆州之地;若北军胜,则我乘势以取江南可也。”,荆州是赤壁之战最重要的战果之一,却被出力很少的刘备摘去了。,第二节 纯策略均衡 三、纳什均衡和下划线法,第二节 纯策略均衡,条件均衡策略下划线法是用下划线分别来表示甲厂商和乙厂商的条件策略。 在甲厂商的支付矩阵 中,找出每一列的最 大数字;在乙厂商的 支付矩阵中,找出每 一行的最大数字。 都有划线的支付组合。,三 纳什均衡和下划线法,5,1,2,3,5,
9、6,1,7,甲 厂 商,合作不 合 作,乙厂商,合 作 不合作,第二节 纯策略均衡 四、纳什均衡的特性,第二节 纯策略均衡,在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在。 在纳什均衡存在的条 件下,它可能是惟一 的也可能不惟一。 如果纳什均衡存在, 它可能是最优的也可 能不是最优的。,四 纳什均衡的特性,甲 厂 商,合作不 合 作,乙厂商,合 作 不合作,第二节 纯策略均衡 五、纳什均衡和社会福利,第二节 纯策略均衡,无论其他参与者采取什么策略,某一参与者的惟一的最优策略就是他的占优策略,任何一方都不想偏离各自认为的最优策略。 囚徒困境(Prisoners Dilemma)反映了个人理
10、性和团体理性的冲突,从个人理性角度出发选择的占优策略结局,从整体来看却是最差的。 根据“看不见的手”原理,理性的人在追求自己利益中,会同时增进社会的整体福利。,五 纳什均衡和社会福利,诸葛亮对司马懿的思想轨迹是相当了解; 诸葛亮的行径司马懿也能做出理性判断。,诸 葛,司马,进攻 撤退,守 城弃 城,平手,逃脱,大胜,被擒,被擒,大胜,曹 家,司马,擒拿 放走,使 用除 掉,20,10,-15,-1,-15,8,-10,3,案例“空城计”中的占优策略均衡,案例 “空城计”中的占优策略均衡,资料 囚徒困境,坦 白 不坦白,坦白不 坦 白,-5,-5,-7,-1,-2,-2,-1,-7,甲 方,乙方
11、,双方都存在着偷换策略的诱惑,处于不稳定状态。 即使两个囚徒事先订立了攻守同盟(死不坦白), 他们最终也会背叛同盟。 每个囚徒都希望对方选择抵赖,而自己坦白获释。当他们都这么想并这么做的时候,就形成了都坦白的左上角结局。,资料 囚徒困境,第三节 混合策略均衡 一、混合策略与策略组合,第三节 混合策略均衡,以有限的纯策略为基础的混合策略一定是无限的,源于概率取值的无限性。 甲厂商和乙厂商的混 合策略组合就是一个 概率向量组合。 与纯策略不同,每一 个概率向量是相应参 与人的一个混合策略。,一 混合策略与策略组合,1,9,2,8,4,6,3,7,甲 厂 商,p1p2,乙厂商,q1 q2,案例 猜拳
12、游戏必胜招,一位日本收藏家无法决定让谁来拍卖画作,于是要求佳士得与苏富比老板猜拳定胜负。 佳士得老板向员工们讨教猜拳策略,最后在一名主管的11岁女儿建议下,决定出 ,案例 猜拳游戏必胜招,第三节 混合策略均衡 一、混合策略与策略组合,在混合策略博弈中,对于每一个混合策略组合也存在一个支付组合。 参与人都以一定的概率 来选择其纯策略,相应 形成“期望支付”。,第三节 混合策略均衡,一 混合策略与策略组合,1,9,2,8,4,6,3,7,甲 厂 商,p1p2,乙厂商,q1 q2,即使纯策略的纳什均衡不存在,相应的混合策略纳什均衡总会存在。 纯策略纳什均衡作为 特例被包括在混合策 略纳什均衡之中。
13、混合策略博弈的均衡 与纯策略博弈的均衡 恰好完全相同。,第三节 混合策略均衡 二、混合策略的纳什均衡,第三节 混合策略均衡,二 混合策略的纳什均衡,1,1,乙厂商,0.7,甲厂商,e,第三节 混合策略均衡 三、混合博弈的一般理论,参与人A与B的判别式为:A的条件混合策略为:,第三节 混合策略均衡,三 混合博弈的一般理论,b12,a12,a22,b22,a11,b11,b21,a21,参 与 人 A,策 略 1策 略 2,参与人B,策略1 策略2,q1 q2,p1p2,讨论 快餐店喜欢扎堆么?,1/2,1/2,讨论 快餐店喜欢扎堆么,?,第四节 动态博弈 一、竞争者-垄断者博弈,第四节 动态博弈
14、,垄 断 者,竞争者,进 入 不进入,抵制不 抵 制,900,1300,1300,900,1200,900,800,600,900,1300,1300,900,800,600,1200,700,威胁策略一定具有可信性,才能真正发挥作用。,垄 断 者,抵制不 抵 制,竞争者,进 入 不进入,一 竞争者-垄断者博弈,案例 核武环峙中国,毛泽东说: “ 中国人多,不怕扔原子弹”。 强权政治、单边主义和恐怖活动都增加了文明毁灭的危险局部核战争已是不可忽视的现实威胁。 “ 难道上个世纪的梦 魇又回来了吗?”,案例 核武环峙中国,第四节 动态博弈 二、博弈树的纳什均衡,第四节 动态博弈,博弈树模型又称为扩
15、展型博弈模型,用博弈树来描述的序贯博弈又叫做扩展型博弈。,二 博弈树的纳什均衡,竞争者,垄断者,a,b,c,垄断者,进入,不进入,不抵制,抵制,不抵制,抵制,d,e,f,g,(1, 4),(-2, 2),(0, 5),(0, 3),起点,中间点,终点,资料 下棋程序的算法与深度,资料 下棋程序的算法与深度,第一个突破出现在1958年,匹兹堡大学的奈维尔、肖恩和西蒙发现剔除相当大的部分而不影响最后结果,这叫算法。 这是一个纯数学领域的技巧,独立于任何知识而生效。,第四节 动态博弈 三、逆向归纳法,第四节 动态博弈,在所有的纳什均衡中,找到最有可能实现的策略组合,这就是对纳什均衡的“精练”。 逆向
16、归纳法包括两个步骤:第一,从最后阶段的每一个决策点开始,确定参与人此时所选择的策略,并把其他策略删除;第二,对简化博弈重复删除程序,直到最后得到最简博弈。 实际上,逆向归纳策略总是属于纳什均衡,尽管纳什均衡并不一定是逆向归纳策略。,三 逆向归纳法,案例 爱情的“蜈蚣博弈”,芳,芳,芳,芳,芳,呆,呆,呆,呆,呆,案例 爱情的“蜈蚣博弈”,第四节 动态博弈 四、优势与理性,第四节 动态博弈,动态博弈的行动总有先后顺序,一些博弈具有 先动优势(first-mover advantage),另一些博弈具有后动优势(second-mover advantage)。 在不完全信息下,顺序更重要:产量竞争
17、可能具有先动优势,价格竞争可能有后动优势,但有的博弈如抓阄没有先动优势和后动优势。 “优势”是指自己的这个策略相比较其他策略有优势,而不是相比对手策略一定占有优势。,四 优势与理性,97 0 1 2 0,案例 海盗分金币,案例 海盗分金币,第四轮,第三轮,第二轮,第一轮, , 100 0 0, 98 0 1 1, ,第四节 动态博弈 四、优势与理性,第四节 动态博弈,与同时博弈相比较,动态博弈提供了更多的信息关于参与人的决策秩序。 在具有“以牙还牙”策略的无限次重复博弈中,厂商都会采取合作策略并遵守协议。 博弈论模型是以理性为基础的,就是使自己的收益最大化,面临的难题是:要对所有影响策略和结果
18、的因素和变量进行定义、限制、分离或解释,但总是存在未知因素无法解释。,四 优势与理性,资料 纳什在颁奖典礼上的话,资料 纳什在颁奖典礼上的话,我一直相信数学、方程 式、逻辑推理,但是当 我回过头想,我问自己 什么才是正确的逻辑推 理,是由谁决定的? 就是“爱”是一种特殊的感觉,是没有办法依靠正常逻辑的推理去判断的,然后我清醒了,你是我的全部,谢谢!,案例 出千与赌徒,出千者的目很明确,都是为一夜暴富,但要知道出千的代价。 赌场到处是阴谋与陷阱,要想不致跌入深渊,就不要沾赌。 职业魔术师的行规里有明确规定,必须以正途来发展魔术。 赌博害人终害己 !,案例 出千与赌徒,赌博确实是令人疯狂的游戏,然而赌局上有这么多陷阱等着你自己跳进来。,视频 赌场迷局,视频 赌场迷局,第十章 博弈论初步 本章作业,本章作业,指南,第八单元, 分析:第 6 题; 计算:第 6、9 题。,教材, 328-329 页,第 7、15 题。,