收藏 分享(赏)

博弈论与经济行为1.ppt

上传人:kpmy5893 文档编号:7863165 上传时间:2019-05-28 格式:PPT 页数:43 大小:607.50KB
下载 相关 举报
博弈论与经济行为1.ppt_第1页
第1页 / 共43页
博弈论与经济行为1.ppt_第2页
第2页 / 共43页
博弈论与经济行为1.ppt_第3页
第3页 / 共43页
博弈论与经济行为1.ppt_第4页
第4页 / 共43页
博弈论与经济行为1.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、Lecture 13,博弈论与经济行为,2,Introduction,到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾。,如何克服和解决人们之间的利益冲突?如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面? 博弈论(game theory)为解决这些问题提供了有力工具。 博弈论以人的理性为基本假定,强调策略性一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。 20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的

2、相互影响和制约方面取得了重大进展。 大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。,3,(一) 两个充满理性与智慧的博弈故事,Introduction,猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到食物。 若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去踩,大猪还有机会在小猪吃完之前抢吃到食物的一半。这两头猪会采取什么策略呢? 答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板和食槽之间。 原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,当然

3、不去踩了。反观大猪,明知小猪不为,那么自己为之总还是要比不为强。,1. 智猪博弈的故事,4,智猪故事揭示了大、小企业的关系。当企业定位于“大猪”时,应选择“主动获得”之优势策略;当定位于“小猪”时,应选择“等待获得”,这也是优势策略。比如,研究开发、为新产品做广告,这对大企业值得,对小企业是得不偿失的。完全市场中,作为一个理性企业,最可能的情况是小企业把精力花在模仿上,或等待大企业打开市场后出售廉价产品。而大企业应当以主动的态度来开拓市场。 智猪故事还给竞争中的弱者以等待为最佳策略的启发。博弈中,每一方都想方设法攻击对方、保护自己,最终取得胜利;同时,对方也是一个与你一样的理性人,他会这么做吗

4、?这就需要更高明的智慧。 任何理性企业都必然会像智猪那样,总是选择优势策略。,Introduction,(三) 两个充满理性与智慧的博弈故事,1. 智猪博弈的故事,(启示),5,Introduction,(三) 两个充满理性与智慧的博弈故事,2. 鱼与鱼竿的故事,从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓鲜鱼。 得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题,可很快又感到肚内空空,最终饿死在空鱼篓旁边。 另外一个得到鱼竿的人提着鱼竿朝向遥远的大海走去,当他终于来到海边的时候,也用尽了最后一点力气而死去。 不久之后,同样是两个饥饿的人,也从智者那里得到了一根鱼竿和一篓鲜鱼。不同的是

5、: 他们一起去寻找大海。每到饥饿的时候,就从鱼篓中拿出一条鱼吃。 当他们最终来到海边的时候,这两个人就拿着那根鱼竿开始了捕鱼为生的日子!,6,(二) 博弈论的研究对象,博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想。比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间 “上有政策,下有对策” ;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。 博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。 博弈论的目的是要研究

6、人们之间这种不相容的行为,推广标准的一人决策理论。 博弈论关注的问题:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动?,Introduction,7,(三) 博弈的标准形式与分类,基本要素:局中人(players)、策略(strategies)、收益(payoffs) 局中人以策略定胜负,以收益最大化为目标。 标准形式(normal form):G = (Xi, fi)n,其中 Xi 为局中人 i 的策略集合, fi : S R 为局中人 i 的收益函数(i = 1,2,n)。 S = X1 X2 Xn 叫做博弈G 的局势集合。 局势:策略 n

7、元组 (x1, x2, xn) ( xiXi,i = 1,2,n)。 博弈的分类:一般按照博弈的基本要素进行分类。 按人数分:二人博弈、多人博弈 按策略分:有限(策略)博弈、无限(策略)博弈 按收益分:常和(零和)博弈、变和博弈 按性质分:非合作博弈、合作博弈 按次序分:同时移动博弈、先后移动博弈(序贯博弈) 交叉分类:以上分类方式的结合,比如二人零和有限博弈。,Introduction,8,矩阵博弈,我们先以矩阵博弈为重点,建立博弈论的基本分析框架。 矩阵博弈:二人零和有限博弈,这是最简单的博弈形式。 特点:甲与乙利益冲突,一方的收益就是对方的损失。 甲的策略集 X =x1, x2, xm;

8、 乙的策略集Y =y1, y2, yn S = X Y =(xi, yj): i =1,2,m ; j =1,2,n 甲的收益函数 f : S R;乙的收益函数 g : S R 零和:f (xi, yj) + g (xi, yj) = 0 (i =1,2,m ; j = 1,2,n) 标准形式:G = (X, f ; Y, g) = (X,Y, f ) 矩阵博弈的矩阵表示:甲的收益矩阵 f 即可表示矩阵博弈。,9,(一) 古诺均衡,局中人的目标:选择合适的策略以使自己的收益(对方的损失)达到最大,也即让对方的收益(自己的损失)达到最小。 假定:甲和乙彼此了解对方的收益矩阵,双方都清楚自己的收益

9、就是对方的损失。 博弈过程:每个人都根据对方的行动来确定自己的行动,每个人都不断地在对方选定了策略的情况下来调整自己的策略以使自己的收益达到最大。 博弈结局:当策略调整达到这样的局势 (xh, yk) 使得 xh 是甲在乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的情况下的收益最大策略的时候,双方策略调整宣告结束,博弈得以确定。此时的局势(xh, yk)就是古诺均衡(最优解),即,矩阵博弈,10,1. 最大最小原理,依据定义,矩阵博弈 f 的古诺均衡正对应于矩阵 f 的鞍点。 鞍点定理(最大最小原理) 是矩阵 的鞍点(即局势(xh, yk)是矩阵博弈 f 的古诺均衡)当且仅当下述

10、等式成立:,矩阵博弈古诺均衡的求解步骤 从矩阵各行的最小元中找出最大元,称为最大最小元; 从矩阵各列的最大元中找出最小元,称为最小最大元; 如果最大最小元与最小最大元一致,那么该元素就是鞍点,代表矩阵博弈的古诺均衡。,(一) 古诺均衡,矩阵博弈,x1,y1,x2,x4,x3,y3,y4,y5,Y,X,z,鞍点,古诺均衡,y2,11,2. 两个博弈事例,例1. 广告竞争:存在古诺均衡,单位:万元,(一) 古诺均衡,矩阵博弈,例2. 便士匹配:没有古诺均衡甲、乙独立决定出示硬币正或反面。若两人出示相同,甲赢乙1元;若出示相反,乙赢甲1元。甲的收益表如下:,12,3. 稳妥策略与不稳定性,只有当收益

11、矩阵的最大最小元与最小最大元一致时,矩阵博弈才有古诺均衡(最优解)。 最大最小元和最小最大元总存在,但二者未必一致,从而矩阵博弈可能没有最优解。例如,便士匹配博弈没有最优解。 矩阵博弈可能没有最优解的真正原因是什么? 稳妥策略 甲的稳妥策略:甲的收益矩阵的最大最小元; 乙的稳妥策略:甲的收益矩阵的最小最大元。 问题的答案:原因在于稳妥策略可能不稳定。 不稳定的稳妥策略不能使博弈中的策略调整过程结束。 即使甲和乙都选择稳妥策略,但若稳妥策略不稳定,那么博弈就无法达到古诺均衡。,矩阵博弈,(一) 古诺均衡,13,(二) 混合策略,为了消除古诺均衡未必存在的困惑,人们提出使用混合策略,即一种连当事人

12、自己都不知道会采取什么行动的策略,对手就更不得而知了,从而使得局中人的行动变得相当诡异。,考虑二人有限博弈G = (X, f ; Y, g): X = x1, x2, xm:甲的纯策略集合; Y = y1, y2, yn:乙的纯策略集合; S = X Y :博弈 G 的纯局势集合。 混合策略(mixed strategies):以一定的概率采取一种策略。 甲的混合策略集合: 乙的混合策略集合: G 的混合局势集合: 甲的预期收益: 乙的预期收益: 混合扩充:博弈 叫做 G 的混合扩充。,矩阵博弈,14,1. 矩阵博弈的混合扩充,定理 博弈 G = (X, f ; Y, g) 为常和博弈 当且仅

13、当 G 的混合扩充 为常和博弈。当G 是常和博弈时,G 与 具有相同的收入常和。因此,矩阵博弈的混合扩充仍为二人零和博弈。 矩阵博弈 G 的混合均衡:是指 G 的混合扩充 的古诺均衡。即,G的混合局势( p*,q*)叫做 G 的混合均衡(混合最优解)是指( p*,q*)满足如下条件: 定理(混合均衡的存在性) 任何矩阵博弈都有混合均衡。 矩阵博弈 f 的混合均衡正对应于函数 Ef 的鞍点。 鞍点定理(最小最大原理) ( p*, q*)是矩阵博弈G 的混合均衡(即函数 Ef 的鞍点) 当且仅当 下述等式成立:,(二) 混合策略,矩阵博弈,15,2. 事例:求解便士匹配博弈的混合均衡,便士匹配博弈

14、中,甲的收益矩阵为,寻找混合均衡,就是去找出 使得,(二) 混合策略,矩阵博弈,16,3. 混合均衡集的特点,博弈值: 混合均衡的存在性及鞍点定理,保证了V(G)是良好定义的,并且当( p*,q*)是混合均衡时,V(G) =Ef (p*,q*)。 博弈值在解释均衡及求解混合均衡方面相当有用。 还可通过V(G) 证明矩阵博弈的混合均衡集的下述特点。 令,定理 对于甲和乙的矩阵博弈G = (X, Y, f )来说,T = T1T2 且混合均衡集 T 是空间 的非空有界闭凸子集,从而甲的混合最优策略集T1是 的非空有界闭凸子集,乙的混合最优策略集T2 是 的非空有界闭凸子集。,(二) 混合策略,矩阵

15、博弈,17,二人博弈,矩阵博弈仅仅是一类简单又典型的二人常和博弈,经济学中遇到的博弈往往都是变和博弈。 矩阵博弈理论之所以重要,是因为它为研究变和博弈提供了很好的分析思路和框架。 现在,我们来在矩阵博弈理论的基础上建立一般的二人博弈理论。 二人博弈 :古诺均衡 二人有限博弈:策略集合 X 和Y 为有限集合。 二人无限博弈:策略集合 X 和 Y 为无限(任意)集合。二人博弈的重复:博弈不只进行一次,而是要进行多次。,18,(一) 二人有限博弈,二人博弈,古诺均衡 应对 yj 的上策 xi( j):当乙采取 yj 时,甲采取 xi( j) 是最好的,即 f i( j) j 是 f 的第 j 列的最

16、大元: 。 应对 xi 的上策 yj(i):当甲采取 xi 时,甲采取 yj(i) 是最好的,即 g i j(i) 是 g 的第 i 行的最大元: 。 甲的上上策 xi*:不论乙采取什么策略,xi*都是甲的上策,即 f 的第i*行最大: 。 乙的上上策 yj*:不论甲采取什么策略,yj*都是乙的上策,即 g的第j*列最大: 。 占优解(xi*, yj*): xi*是甲的上上策, yj*是乙的上上策。,19,1. 求解方法,二人博弈,(一) 二人有限博弈,最大最小原理只适用于矩阵博弈,一般的二人有限博弈的求解只能采取通用方法。 把局中人甲和乙的收益矩阵写在同一张表中。 圈出甲的收益矩阵各列的最大

17、元。 圈出乙的收益矩阵各行的最大元。 收益表中同时出现两个圈的位置即为古诺均衡。如果没有一个位置出现两个圈,就说明该博弈的古诺均衡不存在。 如果在甲的收益矩阵的某一行上全部带圈,则就出现了甲的上上策;同样,若在乙的收益矩阵的某一列上全部带圈,则就出现了乙的上上策。 如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占优解。否则,博弈没有占优解。,20,2. 求解事例,二人博弈,(一) 二人有限博弈,囚徒难题,古诺均衡,上上策,上上策,智猪博弈,上上策,均衡,次优均衡剔除,找出下列博弈的古诺均衡,古诺均衡 (x2, y1) (x4, y4) 无上上策,21,,预期收益都为2/3。,

18、3. 混合策略,二人博弈,(一) 二人有限博弈,G = (X, f ; Y, g)的混合扩充: G 的混合均衡( p*, q*): 角谷不动点定理 设 T 是有限维欧氏空间的非空有界闭凸子集,F: T T 是集值映射。若 F 上半连续且对任何xT,F(x)都是非空闭凸集,那么F 必有不动点,即(xT )(xF(x)。 定理(混合均衡存在性) 任何二人有限博弈都有混合均衡。,例. 性别之战:性别差异导致收益差异,22,假设G1 X 是拓扑向量空间V1的非空紧凸子集;乙的策略集合Y是 拓扑向量空间V2的非空紧凸子集;故局势集合 S 是拓扑向量空间V1 V2 的非空紧凸子集。 假设G2 甲的收益函数

19、 f (x,y)连续且关于策略变元 x 弱拟凹;乙的收益函数g(x,y)连续且关于策略变元 y 弱拟凹。,(二) 二人无限博弈,G = (X, f ; Y, g):X 和Y 为无限集合,S = X Y 。 二人有限博弈的混合扩充是二人无限博弈,二人无限博弈的混合扩充依然是二人无限博弈。因此,二人无限博弈是二人博弈的一般情形,无需再讨论其混合扩充。 古诺均衡(x*, y*):,X,Y,z,f (x*, y*),古诺均衡,g (x*, y*),二人博弈,x*,y*,23,1. 均衡的存在性与反应函数,范格不动点定理 设T是拓扑向量空间的非空紧凸子集,集值映射 F : T T 上半连续且对任何 xT

20、,F(x) 都是非空闭凸集。则 F 有不动点,即(tT)(tF(t)。 定理(古诺均衡的存在性) 任何满足假设G1和G2的二人无限博弈都有古诺均衡。 反应函数 甲对乙的反应:当乙采取策略 y时,甲的应对上策 x=(y)为:f (x, y) = max f (x, y): xX 。 (y):甲的反应函数。 乙对甲的反应:当甲采取策略 x时,乙的应对上策 y=(x)为:g(x, y) = max g(x, y ): y Y 。(x):乙的反应函数。 古诺均衡(x*, y*):,(二) 二人无限博弈,二人博弈,24,2. 用反应函数求解古诺均衡,比如,,(二) 二人无限博弈,二人博弈,一般情形:找出

21、反应曲线的交点,如右图所示。 特殊情况:X 和 Y 都是实数区间,收益函数 f : XR 和 g : Y R可微。于是,反应函数由下述方程确定:,Y,X,x1,x2,x3,x4,x5,x6,x7,x8,y1,y2,y3,y4,y5,古诺均衡,甲的反应曲线,乙的反应曲线,25,(三) 重复博弈,虽然人们对二人博弈的最优解作了深入研究,但让局中人找到最优解却不是一件容易的事情,需要反复实践和锻炼,就好像棋手下棋一样,需要反复不断地下,才能越来越接近最优解。可见,博弈是需要重复进行。 但到目前为止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重复。 事实上,当博弈重复进行时,其最优结局可能会与

22、一次性博弈的均衡有所差异。 下面以囚徒难题博弈为例,来说明重复博弈的最优解。我们将分两种情况讨论:博弈重复进行有限次博弈重复进行无限次,二人博弈,26,1. 有限次重复博弈,每个局中人都知道博弈将重复一个固定的次数。 最后一次博弈中局中人的推理:这是最后一次行动,每个人都认为此时是在进行一次性博弈,因而古诺均衡的标准逻辑得以应用,结果局中人双方选择“背叛”。 倒数第二次博弈:这里似乎每个人都重视合作,可以向对方发出“善意”的合作信号,以便在下次博弈中继续合作。但理性的局中人清楚,最后一次博弈中对方必然背叛。因此他在倒数第二次博弈中选择合作就没有优势,故要选择背叛。 倒数第三次博弈:局中人的推理

23、与倒数第二次一样,结果在倒数第三次博弈中,局中人依然选择背叛。 结局:逆向归纳(backward induction)可知,每次博弈中双方都要“背叛”,有限次重复博弈的最优解依然是古诺均衡。 古诺均衡是局中人双方的短期利益所在。,(三) 重复博弈,二人博弈,27,2. 无限次重复博弈,(三) 重复博弈,二人博弈,每个局中人都知道,博弈要无限重复进行下去。每个局中人的策略都是一个函数序列,表明每个人在每个阶段的策略选择都是此阶段之前的博弈历史的函数。这样,局中人的收益是各阶段收益的贴现值之和(向时刻0贴现): 。 R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。,只要贴现率r 2,就有R

24、T R,即选择背叛无利可图,还是合作为好。贴现率小于2是平常的,说明通常情况下,只要博弈能够无限次重复下去,则可实现“(合作,合作)”。 双方选择合作是局中人双方的长期利益所在。,28,多人非合作博弈,二人一次性博弈是典型的非合作博弈,局中人之间没有串通和勾结,各个局中人都是独立决策和独立行动。 20世纪50年代,美国数学家纳什成功地将这种博弈模式推广到多人情形,接连发表了多篇研究论文,为现代博弈论的形成和发展奠定了坚实基础。 纳什对多人非合作博弈作出了明确界定,提出了多人非合作博弈的“纳什均衡”概念,并应用角谷不动点定理证明了纳什均衡的存在性。,由于纳什均衡是对矩阵博弈的古诺均衡概念的推广,

25、因此人们也常常把纳什均衡称作古诺-纳什均衡。,纳什均衡存在性定理的重要意义:该定理的结论可以直接向经济系统推广,并且这种推广是阿罗和德布罗重建瓦尔拉一般均衡理论大厦的关键所在。,29,G 的混合扩充:,(一) 非合作的多人有限博弈,定理(纳什定理) 任何非合作 n 人有限博弈都有混合最优解。,多人非合作博弈,博弈 G = (Xi, fi )iI :,纳什均衡 :,30,(二) 非合作的多人连续博弈,连续博弈:策略集合为拓扑空间,收益函数为连续函数。,x*S是纳什均衡 x* (x*)(即x*为 的不动点)。 假设G1 每个局中人 i 的策略集合 Xi 都是某个拓扑向量空间Vi 的非空紧凸子集,从

26、而局势集合S是拓扑向量空间V1Vn的非空紧凸子集。 假设G2 连续且关于策略变元 xi 弱拟凹。 定理(均衡存在性) 任何满足假设G1和G2的 n 人非合作博弈都有纳什均衡。,多人非合作博弈,(i 的上策集),31,(三) 带约束条件的纳什均衡,假设G3 在带约束的博弈G = (Xi, fi, Bi)iI中,每个局中人 i 的约束集映Bi:SXi都是连续的集值映射,同时对任何xS,Bi(x)都是Xi的非空闭凸子集,并且Bi(x)与局中人i在局势x中的策略无关。 定理(带约束条件的纳什均衡存在性) 任何满足假设G1、G2和G3的 n 人非合作博弈都有纳什均衡。,纳什均衡:,多人非合作博弈,带约束

27、的博弈:,32,合作博弈,当博弈从二人发展到多人参与的时候,局中人就不再像二人博弈那样只是独立行动,而是可以开展合作。 一些局中人联合起来对抗另外一些局中人。他们出于某种动机或需要而结成联盟,互通情报信息,采取一致行动,以便取得对自己有利的结果。 这种相互配合、彼此协作、结成联盟的现象就是合作博弈的原型。 在合作博弈中,局中人自己的策略选择已经不再是什么重要事情,关键是联盟如何选择策略,如何采取一致行动,联盟的收入如何向其成员进行分配。 收入分配问题至关重要,它决定着局中人能否形成联盟,盟外人又是否愿意加入到联盟中来。 现在,我们来讨论这些问题,建立多人合作博弈的理论。我们将以有限博弈为对象展

28、开讨论,至于无限博弈的情形,这里的理论和方法都可以自然地推广过去。,33,(一) 联盟对抗,博弈 G = (Xi, ui)iI ,局中人集合 I = 1,2,n。 合作表现为局中人结盟,即形成联盟。联盟是 I 的子集。 定义 博弈 G 中的一个联盟是指局中人集合 I 的一个子集。 对于这个定义,以下三点值得注意: 如果 A 是联盟,那么 B = I A 也是联盟 A 的余联盟。任何联盟 A 都把局中人分成两个联盟:联盟 A 和余联盟 B。I 和空集 都是联盟且互为余联盟。空集 称为空联盟。 只含一个局中人的集合也是联盟,叫做单人联盟。 通过联盟,合作博弈转化为非合作博弈。若 A 是联盟,那么G

29、 转化为 A 与余联盟 B 的非合作博弈GA = (XA, uA ; XB, uB):局中人 A 和 B,策略集合分别为 XA = iA Xi 和 XB = iB Xi,局势集合为 X = iI Xi = XA XB,局势 x = (x1, xn) = (xA, xB), A 和 B 的收益函数分别为 uA(x) = iA ui(x)和 uB(x) = iB ui(x)。,合作博弈,34,(二) 特征函数,通过联盟 A,G 转化为二人非合作博弈 GA = (XA, uA ; XB, uB),由此可引出G 的特征函数V: V(A)是 uA 在鞍点处的值,等于零和博弈(XA, uA ; XB, u

30、A)的局中人 A在古诺均衡中的收益(冯诺伊曼据此提出了特征函数)。 特征函数V(A)具有以下基本性质: 对于空联盟 来说,V( ) = 0 (这是因为 u = 0)。 若A, BP(I ) 且 AB = ,则V(AB ) V(A) + V(B)。 若G为零和,则V(I ) = 0 且(AP (I )(V(I A) = V(A)。 可加性:如果 V(AB ) = V(A)+V(B) 对一切不相交的联盟 A 和B成立,则称特征函数V 是可加的(即具有可加性)。 当V可加时,V(A) = iAV(i)对一切联盟 A 成立。这表明结盟与不结盟无差别,从而合作没有意义。这种特征函数可加的博弈,称为非本质

31、博弈。人们感兴趣的是本质博弈。,合作博弈,35,(三) 收入分配,特征函数表示联盟总收入。这笔收入在联盟内部又如何分配?为了研究收入分配问题,首先给出收入分配的定义。,定义 博弈 G = (Xi, ui)n 的收入分配(简称分配)是一个 n 维向量(r1, r2, rn) 使得 V(I ) = iI ri 且 ri vi=V(i) (i =1,2,n)。 V(I ) = iI ri :全体局中人组成联盟,每人从中得到收入。 vi =V(i):局中人不与他人结盟而单干的收入; ri vi:局中人加盟的收入不低于单干的收入,联盟的吸引力就在于参加联盟能够得到更多的收入。 v = (v1, v2,

32、vn):单干收入向量。V(I ) iI vi (特征函数性质)。 收入分配具有下述一些性质: (r1, r2, rn) 是分配 存在 (a1, a2, an) 0 使得 ri = vi + ai (i = 1,2,n) 且iI ai = V(I ) iI vi。 n 人非本质博弈的分配只有单干收入向量v = (v1, v2, vn)。 本质博弈的分配有无限多个。,合作博弈,36,(四) 核心最优解,AP(I) 是收入分配 t = (t1, t2, tn) 的反对者联盟,是指存在另一种分配 r = (r1, r2, rn) 使得 (V(A) iA ri) & (iA)(ri ti)。 核心最优解

33、:是指不存在反对者联盟的收入分配。只有这种收入分配,才能被所有局中人接受。 G 的核心(core) C(G):是指由所有核心最优解组成的集合 。 占优分配:对于收入分配 r 和 t, r A t (在联盟 A 中 r 比 t 占优)是指V(A ) iA ri 且 ri ti 对一切 iA 成立;rt ( r 比 t 占优)是指存在联盟 A 使得r A t。 占优关系 A 具有传递性,但占优关系 不具有传递性。 若 r A t 且 A ,则 A I 且 A 不是单人联盟。 对任何收入分配 r= (r1, r2, rn),rC(G) 当且仅当 iA ri V(A)对一切非空联盟 A 成立。 当 G

34、 为零和本质博弈时,C(G) = 。,合作博弈,37,序贯博弈,迄今为止,我们讨论的博弈都具有简单的动态结构,即它们是一次性博弈,或者是一次性博弈的重复序列,而且还具有简单的信息结构,即每个局中人都知道其他局中人的收益情况及可以采用的各种策略。换句话说,各个局中人都是同时移动的。 然而实际中,许多利益较量博弈并不具备这种结构,局中人的决策和行动具有先后次序,即每个局中人都是在看到其他对手的行动后才开始行动的。 这种局中人在行动上具有先后次序的博弈,就是所谓的序贯博弈(sequential game)。对序贯博弈进行研究,将会产生一些新的概念和方法。,38,(一) 博弈的扩展形式:博弈树,省略号

35、,序贯博弈,39,(二) 子博弈与逆向归纳求解法,5 4 1,7 6 9,6 5 3,4 9 6,2 5 3,9 8 1,3 6 9,4 5 8,甲,乙,丙,序贯均衡,乙,丙,丙,丙,序贯博弈,40,完全均衡是序贯博弈的这样一种结局:局中人在所有到达的子博弈中都处于纳什均衡状态。 完全均衡 = 序贯均衡 + 纳什均衡,(三) 信息集与完全均衡,非纳什均衡之解,甲,乙,乙,正,正,正,反,反,反,10 10,15 8,12 6,8 5,纳什 均衡,序贯 均衡,乙的信息集,序贯博弈,41,子博弈完全均衡(subgame perfect equilibrium)是指这样的序贯均衡,其在任何子博弈中都

36、处于纳什均衡状态。,(四) 子博弈完全均衡,甲,乙,乙,正,左,左,反,右,右,1 3,2 3,0 0,2 1,完全 均衡,子博弈 均衡,子博弈 完全均衡,序贯博弈,42,第13次作业(共3道题),如果把落下的食物量减半或加倍,那么智猪博弈的结局又会如何? 门卫和小偷的故事: 门卫偷懒,小偷偷盗,小偷得到收益V,门卫受到处罚而得收益D(负收益)。 门卫提高警惕,小偷偷盗,小偷被逮住受到处罚而得收益P(负收益),门卫收益为零。 门卫偷懒,小偷没有偷盗,小偷收益为零,而门卫得到了放松和休息的收益R。 门卫提高警惕,小偷没有偷盗,双方收益都为零。该博弈是否存在纳什均衡?如果存在,求出纳什均衡;如果不

37、存在,求出混合纳什均衡。 (第3题见下一页),(12月20日前,通过e-mail交给助教闫勇),43,第13次作业(共3道题),某行业被企业A和B垄断,这两家企业都在努力制造产品差别以增强各自的竞争力。已知企业A和B的产品需求函数分别为: 和 ,其中Q1和P1分别表示A的产品的需求量和价格,Q2和P2分别表示B的产品的需求量和价格。A和B的固定成本都为20,边际成本都为0,并且他们都能各自独立制定自己产品的价格。 求纳什均衡中,企业A和B各自的价格和利润。 如果A和B勾结串通,勾结利润对半分,那么他们的价格和利润为多少? 从短期来看,A和B会勾结串通吗?从长期来看,情况又会如何?,(12月20日前,通过e-mail交给助教闫勇),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报