1、经济博弈论教材 教学课件,主编:谢识予 出版:复旦大学出版社,教材:,经济博弈论(第二版)复旦大学出版社,2002年1月经济博弈论习题指南复旦大学出版社,2003年1月,第一章 导论,本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。,本章分五节,1. 1什么是博弈论 1. 2几类经典博弈模型 1. 3博弈结构和博弈的分类 1. 4博弈论历史和发展的
2、简要评述 1. 5博弈论在我国的应用,1.1 什么是博弈论,1.1.1 从游戏到博弈 1.1.2 一个非技术性定义,1.1.1 从游戏到博弈,博弈就是策略对抗,或策略有关键作用的游戏博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏下棋、猜大小经济寡头产量决策、市场阻入、投标拍卖政治、军事美国和伊拉克、以色列和巴勒斯坦,1.1.2 一个非技术性定义,定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择
3、并加以实施,各自取得相应结果的过程。四个核心方面博弈的参加者(Player)博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs),1.2 几个经典博弈模型,1.2.1 囚徒的困境 1.2.2 赌胜博弈 1.2.3 产量决策的古诺模型,1.2.1 囚徒的困境,囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷,一、基本模型,-5, -5,0, -8,-8, 0,-1, -1,坦
4、 白,不坦白,坦 白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚 徒 1,囚徒1:坦白 囚徒2:坦白,二、双寡头削价竞争,政府组织协调的 必要性和重要性,寡头1:低价(70) 寡头2:低价(70),1.2.2 赌胜博弈,赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示 赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”,一、田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略,二、猜硬币博弈,三、石头、剪子、布,0, 0,1, -1,-1, 1,-1, 1,1, -1,0, 0,1, -1,-1, 1,0, 0,
5、石 头,剪 子,布,博弈方2,石 头,剪 子,布,博 弈 方 1,1.2.3 产量决策的古诺模型,古诺模型是寡头产量竞争,是市场经济中最常见的问题之一 古诺1838年提出,直到现在还是经常使用 古诺模型有很多扩展 古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值,一、三厂商离散产量,二、n个厂商连续产量,1.3 博弈结构和博弈分类,1.3.1 博弈中的博弈方 1.3.2 博弈中的策略 1.3.3 博弈中的得益 1.3.4 博弈的过程 1.3.5 博弈的信息结构 1.3.6 博弈方的能力和理性 1.3.7 博弈的分类和博弈理论的结构,1.3.1 博弈中的博弈方,博弈方:独立决策、
6、独立承担博弈结果的个人或组织 博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,一、单人博弈只有一个博弈方的博弈,例一:单人迷宫,例二:运输路线,单人博弈实质 个体最优化问题,二、两人博弈,两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈 两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致,三、多人博弈,三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利益
7、并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。申办奥运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法,1.3.2 博弈中的策略,策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限多个,1.3.3 博弈中的得益,得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策略的组合 得益是各博弈方追求的根本目标及行为和判断的主要依据 根据得益的博弈分类:零和博弈、常和博弈、变和
8、博弈,零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同猜硬币,田忌赛马,石头-剪刀-布 常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系分配固定数额的奖金、利润,遗产官司 变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。囚徒困境、产量博弈、制式问题等,1.3.4 博弈的过程,博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。 博弈过程对博弈结果也有重要影响。 根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。,静态博弈:所有博弈方同时或可看作同时选择策略的博弈田忌赛马、猜硬币、古诺模型动态博弈:各博
9、弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动弈棋、市场进入、领导追随型市场结构,重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能长期客户、长期合同、信誉问题 有限次重复博弈 无限次重复博弈,1.3.5 博弈的信息结构,完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益 不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈” 完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈 不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,1.
10、3.6 博弈方的能力和理性,完全理性和有限理性 完全理性:有完美的分析判断能力和不会犯选择行为的错误 有限理性:博弈方的判断选择能力有缺陷 个体理性和集体理性 个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈,1.3.7 博弈的分类和博弈理论的结构,非合作博弈和合作博弈 非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈) 静态博弈,动态博弈,重复博弈 完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈 零和博弈和非零和博弈,单人博弈和多人博弈
11、,1.4 博弈论历史和发展简述,1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济学的融合,1.4.1博弈论的早期研究,博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科,2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”等。 1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的
12、极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果,1.4.2博弈论的形成,冯.诺伊曼和摩根斯坦博弈论和经济行为 Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述方法,1.4.3 博弈论的成长和发展 一、第一个研究高潮,本世纪40年代末和50年
13、代初,1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验; 1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。 奥曼(R. J. Aumann)“40年代末50年代初是
14、博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”,二、50年代中后期一直到70年代博弈论发展的青年期,1954-1955年提出了“微分博弈”(Differential games)的概念。 奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。 “重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。 1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。 博弈论在进化生物学(Evolutionary
15、Biology)中的公开应用也是在60年代初出现的。,塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium) 1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium) 海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。 海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。 70年代“进化博弈论”(Evo
16、lutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。 “共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。,三、40年代末到70年代末是博弈论发展的重要阶段,这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。 对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定
17、环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。,1.4.4博弈论的成熟及与主流经济学的融合 一、80、90年代是博弈论走向成熟的时期,1981(Elon Kohlberg) “顺推归纳法”(Forward induction) 克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria) 1982年斯密(John
18、Maynard Smith)出版了进化和博弈论() 1984年由伯恩海姆(B. D. Bernheim)和皮尔斯(D. G. Pearce)提出“可理性化性”(Rationalizability) 海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准, 1991年弗得伯格(D. Fudenberg)和泰勒尔(J. Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念,二、博弈论和经济学诺贝尔奖,1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、塞尔顿(Selten) 1996:不对称信息激励理论:莫
19、里斯(Mirrlees)和维克瑞(Vickrey) 2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场) 2002:实验经济学:史密斯(Smith),心理经济学:卡尼曼(Kahneman),1.5 博弈论在我国的应用,企业经营者的决策思路和工具。 政府的政策和管理思路,与个人、企业和地方博弈的意识。 社会经济问题的理论分析工具,解释经济中许多低效率现象的根源,找出各种经济问题的制度性、环境性原因,揭示各种经济行为和政策的效率意义等。,第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态
20、博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,本章分六节,2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展,2.1 基本分析思路和方法,2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法,2.1.1 上策均衡,上策:不管其它
21、博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;双寡头削价中“低价”。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的,2.1.2 严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:,2.1.3 划线法,2.1.4 箭头法,2.2 纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均
22、衡的定义,策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈:纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2.2.2 纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡
23、,预测不一致的可能,2.2.3 纳什均衡与严格下策反复消去法,上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性,2.3.
24、1 古诺的寡头模型,寡头产量竞争以两厂商产量竞争为例,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂 商 1,以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,2.3.2 反应函数,古诺模型的反应函数,理性局限和古诺调整,2.3.3 伯特兰德寡头模型,价格竞争寡头的博弈模型 产品无差别,消费者对价格不十分敏感,2.3.4 公共资源问题,公共草地养羊问题,以三农户为例n=3,c=4,合作:总体利益最大化,竞争:个体利益最大化,2.3.5 反应函数的问题和局限性
25、,在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,2.4 混合策略和混合策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己
26、策略这类博弈很多,引出混合策略纳什均衡概念,二、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,三、一个例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,四、齐威王田忌赛马,五、小偷和守卫
27、的博弈,加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75,二、制式问题,制式问题混合策略纳什均衡A B 得益 厂商1: 0.4 0.6 0.664厂商2: 0.67 0.33 1.296,三、市场机会博弈,进 不进 得益厂商1: 2/3 1/3 0厂商2: 2/3
28、 1/3 0,2.4.3 混合策略和严格下策反复消去法,2.4.4 混合策略反应函数,猜硬币博弈,夫妻之争博弈,2.5 纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,2.6 纳什均衡的选择和分析方法扩展,2.6.1 多重纳什均衡博弈的分析 2.6.2 共谋和防共谋均衡,2.6.1 多重纳什均衡博弈的分析,帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡,一、帕累托
29、上策均衡,(鹰鸽博弈) 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。,二、风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。,三、聚点均衡,利用博弈设定以外的信息和依据选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子,四、相关均衡,三个纳什均衡: (U,L)、(D,R) 和混合策略均衡(1/2,1/2),(1/2,1/2)
30、 结果都不理想,不如(D,L)。,可利用聚点均衡(天气,抛硬币),但仍不理想。,相关装置: 1、各1/3概率A、B、C 2、博弈方1看到是否A,博弈方2看到是否C 3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。,相关均衡要点: 1、构成纳什均衡 2、有人忽略不造成问题,一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B) 前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋 (Coalition)问题:博弈方1和2同时偏离。,2.6.2 共谋和防共谋均衡,二、防共谋均衡,如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通
31、”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B) 是防共谋均衡(U,L,A)不是防共谋均衡,第三章 完全且完美信息动态博弈,本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子
32、博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。,本章分六节,3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论,3.1 动态博弈的表示法和特点,3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点,3.1.1 阶段和扩展性表示,阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈,3.1.2 动态博弈的基本特点,策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路径 得益对应每条路径,
33、而不是对应每步选择、行为动态博弈的非对称性先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,不同版本的开金矿博弈分钱和打官司的可信性,3.2.2 纳什均衡的问题,第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的
34、基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题,3.2.3 逆推归纳法,定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。,乙,不借,借,(1,0),3.3 子博弈和子博弈完美纳什均衡,3.3.1 子博弈 3.3.2 子博弈完美纳什均衡,3.3.1 子博弈,定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称
35、为原动态博弈的一个“子博弈”。,3.3.2 子博弈完美纳什均衡,定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,3.4 几个经典动态博弈模型,3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人代理人理论,3.4.1 寡占的斯塔克博格模型,先后选择产量的产量竞争博弈 把古诺模型改
36、为厂商1先选择,厂商2后选择,而非同时选择即可。,产量 得益 厂商1 3单位 4.5 厂商2 1.5单位 2.25,先行优势,3.4.2 劳资博弈,先由工会决定工资率,再由厂商决定雇用多少劳动力,3.4.3 讨价还价博弈,三回合讨价还价,三回合讨价还价博弈结果的讨论,无限回合讨价还价,3.4.4 委托人代理人理论,一、委托人代理人关系 经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。 委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性 委托人代理人涉及问题:激励机制设计、
37、机制设计理论,委托合同设计问题等,二、无不确定性的委托人代理人模型,R(S)-w(S), w(S)-S,R(E)-w(E), w(E)-E,R(0),0,R(0),0,代理人的选择激励相容约束:w(E)-E w(S)-Sw(E) w(S)+E-S,参与约束:,参与约束,委托人的选择,数值例子,12, 2,0,0,0,0,7,1,E=2, S=1, W(E)=4, w(S)=2,三、有不确定性但可监督的 委托人代理人博弈,偷懒: 委托:0.1*20-w(S) +0.9*10-w(S)0 不委托:0.1*20-w(S) +0.9*10-w(S)0,努力 委托: 0.9*20-w(E)+0.1*10
38、-w(E)0 不委托: 0.9*20-w(E)+0.1*10-w(E)0,因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。,四、有不确定性且不可监督的 委托人代理人博弈,只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。,努力: 0.9*w(20)-E+0.1*w(10)-E 0.1*w(20)-S+0.9*w(10-S),接受: 0.9*w(20)-E+0.1*w(10)-E0,委托: 0.9*20-w(20)+0.1*10-w(10)0,激励相容约束,促使代理人努力的激励相容约束、参与约束,以及
39、委托人选择委托的条件,参与约束,对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10),五、选择报酬和连续努力水平的 委托人代理人博弈,店主和店员的问题,商店的利润 , 是均值为0的随机变量 店员的负效用 , 是店员的努力 机会成本为1 店主采用的报酬计算公式 店员的得益 店员期望得益为 店主的得益为,参与约束: 当店员风险中性时 符合其最大利益 店主选择下限 代入得益公式得:,期望得益为 ,易求得令 得 ,再代入参与约束得 , 求数学期望得 解得 , 则店主的最优激励工资计算公式是,3.5 有同时选择的动态博
40、弈模型,3.5.1 标准模型 3.5.2 间接融资和挤兑风险 3.5.3 国际竞争和最优关税 3.5.4 工资奖金制度,3.5.1 标准模型,博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4 第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合 和 中分别选择 和 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择 和 以后,同时在各自的可选策略(行为)集合 和 中分别选择 和 各博弈方的得益都取决于所有博弈方的策略 即博弈方i的得益是各个博弈方所选择策略的多元函数,3.5.2 间接融资和挤兑风险,下一阶段,(到期,到期) (存
41、款,存款),(提前,提前) (不存,不存),1.2,1.2,第二阶段,建立信贷保证、保险制度, 对存款进行保护、保险的原因,非法集资问题,现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。,3.5.3 国际竞争和最优关税,厂商的得益函数为:,第二阶段厂商选择:,第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:,政府的得益函数;,3.5.4 工资奖金制度,模型假
42、设: 1.雇员i(i=1,2)的产出函数为 , 为雇员努力水平, 为随机扰动。服从分布密度 ,均值为0的随机变量。雇员努力的负效用函数为 ,且 。 2.产量高的雇员得到高工资 ,产量低的得到低工资 。 3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。,雇员选择,雇主决定了工资以后,雇员同时决定努力程度:一阶条件这是雇员所选择努力程度必须满足的基本条件。,利用条件概率的贝叶斯法则:,代入得:两雇员情况一样,对努力程度的选择也相同,即: ,这样就得到:这就是两雇员之间的静态博弈纳什均衡。若进一步假设 ,那么,雇主选择,由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都
43、是0.5,假设雇能得到其他工作机会提供的得益是 ,则保证雇员接受工作的基本条件是:此即“参与约束”。由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束条件可取等号: 于是得到:设上述参与约束条件满足,雇主的利润函数为,雇主的期望利润为 ,因此雇主有如下的最优化问题:上述雇主决策可转化为促使雇员的努力程度满足:一阶条件为:代入两雇员的最优努力水平决定公式得到:,3.6 动态博弈分析的问题和扩展讨论,3.6.1 逆推归纳法的问题 3.6.2 颤抖手均衡和顺推归纳法 3.6.3 蜈蚣博弈问题,3.6.1 逆推归纳法的问题,逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则
44、和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能 逆推归纳法也不能分析比较复杂的动态博弈 在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难 对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”,3.6.2 颤抖手均衡和顺推归纳法,颤抖手均衡,(3, 3),(2, 3),顺推归纳法,3.6.3 蜈蚣博弈问题,该博弈是说明逆推归纳法和博弈分析困难的经典博弈,第四章 重复博弈,本章介绍基本博弈重复进行构成的重复博弈。虽然形式上
45、是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。,本章分三节,4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈,4.1 重复博弈引论,4.1.1 为何研究重复博弈 4.1.2 基本概念,4.1.1 为何研究重复博弈,经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间,4.1.
46、2 基本概念,有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。 无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G( ) 策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分 均衡路径:由每个阶段博弈方的行为组合串联而成,重复博弈的得益,4.2 有限次重复博弈,4.2.1 两人零和博弈的有限次重
47、复博弈 4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈的有限次重复博弈 4.2.4 有限次重复博弈的民间定理,4.2.1 两人零和博弈的有限次重复博弈,零和博弈是严格竞争的,重复博弈并不改变这一点。 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。,4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈,定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍
48、,平均得益的与原博弈G中的得益。,有限次重复削价竞争博弈,有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价),4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈,触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1,两市场博弈的重复博弈(重复两次),(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1) 连续两次采用混合策略(2,2) (A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)轮换策略 一次纯策略+一次混合策略(1.5,3)(3,1.5),