1、博弈论与信息经济学,范文正 述,关于博弈论的某些光环,博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很有面子 Why?因为它以数学为基础,似乎不容易学懂 它有广泛的用途,但很直接有效的运用似乎也不多见 发展很快,这些光环的一点猜测性说明,它曾经很落寞,少数人自己玩得很高兴 它1994获得诺贝尔奖了,好莱坞居然还拿纳什的故事拍电影 它来自数学,对数学不太有感觉的人会觉得它很枯燥,而数学意识强的人却觉得它很好玩 还不够成熟,因为它“重在建设” 我国的博弈论运用还很落后,几乎看不到高水平的运用,博弈论之“数学”的特征,只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有
2、什么艰深的数学 这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义 但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义 所以,一个比较有效的学习方法是重复,博弈论的开拓之功,“开拓”一般具备什么特征? 从学理看:新方法,新模式,新领域 从功效看:新办法,新答案 博弈论兼有之 新方法:不同主体之间数量比较和概率思想的结合 新模式:经验层次的一些“高妙手段”具有逻辑刚性,并非巧合,如“囚徒困境” 新领域:突破了传统经济学的苛刻假设,而且把触角不客气地伸到政治、管理、系统论等领域,博弈论在研究对象之特点上的根本不同,通常的学问或理论体系都以“系统内
3、”为研究对象,如果研究多个主体之间的关系,也须纳入一个框架之中。每个学科都有自己的“整体观”显然,这里有明显的传统科学理性的风味。 博弈论根本不同,它直接研究几个在逻辑层次上并列的主体之间的关系。看似简单的方法,其实开创了一个思路。 它之所以不被广泛应用的一个猜测是:人们目前还不熟悉、不适应这种多维的思维方式。,博弈论在思维方式上的特点,习见的思维方式: 还原论:整体可无穷拆分为不同级别的个体 目的论:事物的发展有其目标 其他事物不变 博弈论思维方式历史理性 多元化、相对化、历史化 事物并不存在一种内在的、永恒的、抽象的“本质”,而只有一种在特定历史框架中的建构。 对传统经济学的启发:将研究对
4、象转向个体,放弃一些没有微观基础的假设,如消费函数及其投资函数,而在给出个人的支付函数及战略空间的条件下,研究每个人都选择其最优战略以最大化个人支付函数时将发生什么。,博弈论的学习特点,很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学习的时候很枯燥 因其与数学密切相关,关于博弈论素养的提高要靠自己的学习、揣摩和领悟习薫悟化 注重数学的严谨,注意基本功 得鱼忘筌,得意忘形,本课程的阅读文献,张维迎博弈论与信息经济学为主要教材 通俗读物:王则柯博弈论平话、白波博弈游戏、潘天群博弈生存 参考书籍:谢识予经济博弈论、姚国庆博弈论(南开),拉斯缪森
5、博弈与信息(北大与三联)、弗登博格博弈论(人民大学),信息经济学(湖北) 期刊文章:非常多,关于博弈论基本问题的文章自1995陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,但水平低,0.导论:博弈论与经济学,0.1博弈论与主流经济学的发展 传统经济学的局限以及博弈论对经济学的重要影响 0.2基本内容的概述 非合作博弈的非技术性概述,0.1博弈论与主流经济学的发展,传统经济学的假设及其局限性 二基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼
6、顾。然而在以下情况不成立: 非完全竞争:垄断越来越普遍 外部性:市场不可能把所有的成本收益都计算在内 公共产品:市场无非解决“搭便车”问题 逆向选择问题:柠檬市场 道德风险问题:为什么市场的交易费用比较高? 百年来,经济学的主要发展围绕以上五方面,如垄断竞争理论、产业组织理论、企业理论、信息经济学、新制度经济学、不确定下的决策(投资理论),宏观经济学,0.1博弈论与主流经济学的发展,传统微观经济学与博弈论的比较 传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无涉,所有其他人的行为都被总结在“价格”参数之中 博弈论中,个人效用不仅依赖于自己的选择,
7、还以来于他人的选择,研究在存在外部经济条件下的个人选择问题 事实上,行为主体的数量通常不多,相互之间存在明显影响 经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理 博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开,0.1博弈论与主流经济学的发展,国外经济学教科书改写,加入大量博弈论内容 博弈论进入主流经济学,反映了: 经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设 经济学的研究对象越来越转向人与人之间行为的相互影响和作用 经济学越来越重视对信息的研究 传统微观经济学的工具是数学(微积分、线性代数、统计学),而博弈论是一种新的数学。以前只有陆军,现在有了空军,其差
8、异不可以道里计,0.1博弈论与主流经济学的发展,博弈论研究的是:当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略 博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学 “深蓝”和“更深的蓝”使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗夫,0.2 博弈论要点,著名案例囚徒困境prisoners dilemma,个人理性最终导致集体理性的缺失,0.2 博弈论要点,博弈:决策主体在互相对抗中,对抗双方(或多方)互相依存的一系列策略和行动的过程集合 参与人的利益有冲突 博弈是一个过程集合(参与人、策略、行动、信息等)。把博弈视为
9、集合是思维从具体到抽象的重要一步 博弈的一个本质特征是策略的相互依存性 博弈论:专门研究博弈如何出现均衡的规律的学问,0.2 博弈论要点,博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡 其中,参与人、行动、结果合称博弈规则 博弈有不同的种类: 从行动顺序角度: 静态博弈。参与人同时选择行动 动态博弈。参与人的行动有先后顺序 从拥有信息角度: 完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识 不完全信息博弈。,0.2 博弈论要点,将二角度结合,博弈有四种: 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈,博弈论模型G
10、P,A,S,I,U,一个博弈需要有五方面内容组成:参与人、行动、信息、结果 P:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化为目标。 A:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。 S:博弈的进程或次序。分为静态博弈和动态博弈。,I:博弈信息,能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的
11、行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。 U:为局中人获得利益,也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。,0.2.1 完全信息静态博弈:纳什均衡,设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。 有时,双方会形成这样一种状态:我的最好策略所依赖的条件就是你的最好策略。换言之:
12、如果你那样做,我这样最好,而你“那样”做恰恰又是你的最佳策略。 通俗地讲:如果别人不动,我也不能动,0.2.1 完全信息静态博弈:纳什均衡,假设n个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略。纳什均衡指的是“由所有参与人的最优战略组成的一个组合” 几个人制订了一个协议,这几个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。 如果一个协议不构成纳什均衡,它就不可能自动实施,需要外力胁迫,这就无所谓“协议”,Nash Equilibrium,A Nash equilibrium, named after John Nash, is a set of strategi
13、es, one for each player, such that no player has incentive动机 to unilaterally单方面change her action. Players are in equilibrium if a change in strategies by any one of them would lead that player to earn获得 less than if she remained保持 with her current strategy. For games in which players randomize (mixe
14、d strategies), the expected or average payoff must be at least as large as that obtainable能得到的 by any other strategy. 纳什均衡,一个策略集合,其中每个参与人没有动机去但方面地改变自己的行为。任何一个人改变策略都会获得更少,这就是纳什均衡。对于随机化的参与人,期望或平均支付至少与其他任何策略一样大,0.2.1 完全信息静态博弈:纳什均衡,纳什均衡的重要性:任何“合理”结果都要满足的条件当某一局中人发现他单方面改变战略可以获取更多时,他会毫不犹豫地改变自己的战略,博弈自然就没有达到
15、均衡 一种制度安排要发生效力,必须是纳什均衡,否则,这种制度安排就没有效力,0.2.1 完全信息静态博弈:纳什均衡,囚徒困境的几个事例: 价格大战 两个寡头企业选择产量 公共产品的供给 军备竞赛 做广告 围观时踮脚尖 应试教育 污染。1968年,格雷特哈丁成功地将“囚徒的困境”与资源耗竭结合起来 , 揭示了生态环境问题与囚徒困境的相似之处。 贸易自由与壁垒,地方保护主义,0.2.1 完全信息静态博弈:纳什均衡,个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 从“纳什均衡”引出“看不见的手” 的一个悖论:从利己目的出发,结果损人不利己。“
16、纳什均衡”提出的悖论动摇了经济学的基石。 从“纳什均衡”还可以悟出:合作是有利的“利己策略”,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是 “己所不欲勿施于人”。,占优战略均衡:不论其他人采取什么策略,A之某策略的payoff总是最高,即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡”(dominant-strategy equilibrium)。反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。
17、 划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。(参见谢识予p.61),0.2.1 完全信息静态博弈:纳什均衡 基本分析思路和方法,例2:圈猪博弈(boxed pigs),0.2.1 完全信息静态博弈:纳什均衡,例3:性别战(battle of sexes),0.2.1 完全信息静态博弈:纳什均衡,先动优势所形成的“解”形成的机会,例4:斗鸡博弈(chicken game)(胆小鬼博弈),0.2.1 完全信息静态博弈:纳什均衡,例5:进入阻
18、挠(entry deterrance),0.2.1 完全信息静态博弈:纳什均衡,可能存在多个纳什均衡,如果某种情况不可能出现(如,不可信的威胁),则可剔除之。精炼,缩小了“解”的个数 如果是动态博弈,从每一个行动选择开始到博弈结束又构成一个博弈,即“子博弈” 精炼纳什均衡:当只当参与人的战略在每一个子博弈中都构成纳什均衡 承诺行动:当事人使自己的威胁变得可信的行动,0.2.2 完全信息动态博弈: 子博弈精炼纳什均衡,很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即,只拥有不完全信息。每个人知己于必然,知人于或然 引入一个虚拟的参与人:自然。它选择了参与人的特征类型。海萨尼
19、转换。 完全但不完美信息博弈。因为使博弈分析成为可能,故称“完全”,但所知不确,故“不完美” 给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大。,0.2.3 不完全信息静态博弈: 贝叶斯-纳什均衡,贝叶斯统计简介,经典统计学需要两种信息:总体和样本 贝叶斯统计加入了“先验信息”,来源于经验和历史资料。其统计分布为“先验分布” Bayes T. R. 17021761。有贝叶斯公式 贝叶斯学派的基本观点:任一未知量都可看作随机变量,可用一个概率分布去描述它,这个分布称为“先验分布”。任意未知量都有不确定性,因此非常适合用概率来表达,后行动者可以通过观察而增加对先行者的了
20、解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息。 博弈过程是不仅是参与人选择行动的过程,还是不断学习的过程。 精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自己的最优化行为。,0.2.3 不完全信息动态博弈: 精炼贝叶斯均衡,1.1博弈论的基本概念及战略式表述 1.2纳什均衡 1.3纳什均衡应用举例 1.4混合战略纳什均衡 1.5纳什均衡的存在性与多重性,1 完全信息静态博弈,1.1博弈论的基本概念
21、及战略式表述,1.1.1基本概念 参与人 i=1,2,n N表示自然 行动。ai表示第i个参与人的一个特定行动Ai=ai表示可供i个选择的所有行动的集合n人博弈中,n个参与人行动的有序集a称为“行动组合” 信息 完美信息:某个信息集只有1个值 完全信息:自然不首先行动或其初始行动为所有参与人知道 共同知识,1.1博弈论的基本概念及战略式表述,1.1.1基本概念 战略s:参与人在给定信息集时的行动规则 静态博弈中,战略等同于行动 战略必须是完备的 支付u。u=ui(s1, ,si, sn) 结果 均衡s*=(s1*, ,si*, sn*) 均衡:一种所有动作的影响都互相抵消,整个系统处于平稳的、
22、均势的、不变的状态,ui(si*,s-i) ui(si,s-i),si si*,是数理逻辑符号,全称量词, 读作“对于全部”或“对于每一个”,Universal quantifier, read “for all“ or “for every“,1.1博弈论的基本概念及战略式表述,1.1.2博弈的战略式表述G 博弈的参与人集合 每个人的战略空间 每个人的支付函数 如果:参与人个数有限,每个参与人的战略有限,则为“有限博弈” 两人有限博弈的战略式表述可以用矩阵表示,纳什均衡是完全信息静态博弈的一般概念,也是所有其他类型博弈的基本要求 1.2.1占优战略均衡 占优战略均衡的定义p.59 如果所有参
23、与人都有占优战略存在,则占优战略均衡是可以预测到的惟一的均衡,1.2 纳什均衡,占优战略均衡是非常合理的预测,但经常不存在,这才是博弈论真正的用武之地 1.2.2重复剔除的占优战略均衡 智猪博弈中,没有占优战略均衡 首先找出某个参与人的劣战略,剔除之,再找,再剔除,直到最后的一个 劣战略、占优战略的定义p.62 弱占优战略的定义p.63 重复剔除的占优均衡的定义p.63,1.2 纳什均衡,1.2.3纳什均衡 很多博弈无法使用重复剔除的方法找到均衡解 定义p.69 没有任何一个战略严格优于纳什均衡战略(严格优,大于,不包括等于) 强纳什均衡p.71,1.2 纳什均衡,1.3.1古诺寡头竞争模型
24、两个寡头企业,市场总产量为Q=q1+q2。市场出清价格P是市场总产量的函数P=P(Q)=8-Q。假设生产无固定成本,且每增加一单位产量的边际成本c相等=2,则其成本分别为2q1、2q2 ,他们同时选择产量 利润:u1=q1(Q)-c1q1=q18-(q1+q2)-2q1=6q1-q1q2-q12 u2=q2(Q)-c2q2=q28-(q1+q2)-2q2=6q2-q1q2-q22 可以寻找纳什均衡:只要两方的一个策略组合(q1*,q2*)相互是对方的最佳对策,就构成一个纳什均衡,如果再可以证明它是惟一的,则可以预言博弈的解 可直接根据定义来寻找,1.3 纳什均衡应用举例,(q1*,q2*)必须
25、是最大值,解得均衡产量为q1*=q2*=2,策略组合(2,2)是惟一的纳什均衡,市场最终产量为2+2=4,价格为8-4=4 双方各自利润2(8-4)-22=4,如果只有一家厂商,总得益U=P(Q)-cQ= Q(8-Q)-2Q=6Q-Q2。其最大产量为6-2Q=0,即Q=3,而得益为9。高于各自产量为2时的总得益8。,1.3.2 Hotelling价格竞争模型 1.3.3 公共地的悲剧 1.3.4 公共物品的私人自愿供给 1.3.5基础设施建设:中央政府与地方政府之间的博弈,1.3 纳什均衡应用举例,1.4 混合战略纳什均衡,有些博弈不存在(纯策略的)纳什均衡 社会福利博弈之例:不存在纳什均衡
26、猜谜游戏之例:不存在纳什均衡,设流浪汉找工作的概率为p,则游荡为1-p 政府的支付: 当政府救济,政府得到3p-(1-p)=4p-1 当政府不救济,政府得到-p+0=-p 流浪汉应比较两种策略: 4p-1-p,p0.2 或者4p-13q, q0.5,1.4 混合战略纳什均衡,纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动 混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动 纯战略可视为混合战略的特例 以混合策略为对象,重新定义效用函数,即期望效用函数p101 再定义纳什均衡p102103 “流浪汉”的纳什均衡:政府以0.5救济,流浪汉以0.2找工作,1.4
27、混合战略纳什均衡,一个参与人使用混合策略的好处是给对方造成不确定性,浑水摸鱼 海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略均衡 如税收检查,检查则不偷税,不检查则偷税。但税务局检查有成本,企业在知道税务局可能检查的情况下,偷税有风险。此时,可以根据某些参数寻找一个混合策略的纳什均衡 几乎所有优先博弈都有优先奇数个纳什均衡。 如果一个博弈有两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡,1.5 纳什均衡的存在性和多重性的讨论,1.5.1纳什均衡的存在性 p113图 X本来是一组自变量,每一个自变量都有一些取值,必然存在一点,使每个人的选择所形成的结果等于自己在这一点上所期
28、望的结果。在这一个点上,所有人的选择重合为一个相同的点。 需要理解两点:多个自变量的取值至少在一个点上是重合的;这个点上每个人都没有偏离自己的规律(符合自己在此种选择下的意愿) 如果有人不选择这一点的取值,则有可能不形成这个点每个自变量都符合自己的规律,1.5 纳什均衡的存在性和多重性的讨论,1.5.2纳什均衡的多重性 最令人无奈的是可能存在多个纳什均衡,仍然存在不稳定性你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡 当一个博弈有多个纳什均衡时,博弈论并没有一个一般的理论注明纳什均衡结果一定会出现。 可以利用外在的信息达到纳什均衡,如
29、性别战 Cheap talk也可能促成纳什均衡 重复博弈也有可能促成纳什均衡 但以上情况并不保证必然出现纳什均衡,2 完全信息动态博弈,不能同时选择和行动的博弈是动态博弈Dynamic Games,后行动者可以先观察别人的行动,自己再选择 本章讨论完全信息下的动态博弈,2.1 博弈的扩展式表述,扩展式表述所“扩展”的主要是参与人的战略空间 战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动方案可供选择,以及知道些什么 此时的战略:如果你这样,我将怎样,2.1 博弈的扩展式表述,要素: 参与人集合 参与人的行动顺序
30、参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件(即“自然”的选择)的概率分布,2.1 博弈的扩展式表述,博弈树的基本元素: 结、枝、信息集 需要注意的概念:前列集、后续集;初始结、决策结、终点结;直接前列结、直接后续结。以及相应的符号 信息集:某个参与人都知道些什么 信息集是用来标注某个人知道些什么信息的,不同的标注表示这个人知道不同的信息p142,2.1 博弈的扩展式表述,如果博弈树的所有信息集都是单结的,则称为“完美信息博弈”,没有任何两个决策结是用虚线连起来的 自然信息集总是假设为单结的 博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序p145 一个参与人在决策
31、之前所适当的事情必须出现在该参与人的决策结之前 有了信息集的概念,扩展式表述也可用来表述静态博弈,2.2 扩展式表述博弈的纳什均衡,需求大,开发者利润8千万,不开发者利润0。 需求大,两者都开发利润各为4千万。 需求小,开发者利润1千万,不开发者利润0。 需求小,两者都开发利润各为-3千万 两者都不开发利润各为0。,博弈树:房地产开发博弈I,博弈树:不允许的情形,结(nodes): 枝(branches): 信息集(information sets):,博弈树的结构,包括决策结和终点结。决策结是参与人采取行动的时点;终点结是博弈行动路径的终点。,枝是从一个决策结到它的直接后续结的连线,每一个枝
32、代表参与人的一个行动选择。,一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结: (1)每一个决策结都是同一个参与人的决策结 (2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。,信息集:房地产博弈II,信息集:房地产博弈III,信息集:房地产博弈IV,几个符号的意义,第i个人的信息集为Hi,其中某特定信息集为hi,在hi的情况下会有A(hi)的行动。他的所有信息集所对应的所有行动A(hi)的集合为Ai,表示聚合,第i个人有信息H,乃有行动A 此时的战略是S(而且是纯战略, 以后用其他字母表示“不纯”战略) maps
33、into,153页第二段:“每一个纯战略都是从信息集到行动集的一个映射,Si可以表示为在每一个信息集hi上的行动空间A(hi)的笛卡儿积”,每一个纯战略都是原因现象依某种对应关系所导致的惟一结果现象 (信息集可视为自变量,行动集可视为因变量) ,纯战略的集合Si就是行动空间A(hi)中各种行动的交叉乘积,完美信息博弈&不完美信息博弈,一个信息集可能包含多个决策结,也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集;如果博弈树的所有信息集都是单结的,该博弈称为完美信息博弈(Game of perfect information);否则就是不完美信息博弈。,2.3子博弈精炼纳什均衡,2
34、.3子博弈精炼纳什均衡,可信性问题 子博弈和逆向归纳法 子博弈精炼纳什均衡应用举例 有同时选择的两阶段动态博弈,可信性:开金矿博弈,甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资。甲希望乙能将1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢? 参见谢识予p128,开金矿I无法律的博弈,(1,0),开金矿II有法律保障的博弈,子博弈由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件: (1)x是一个单结信息集; (2)子博弈不改变原博弈的信息集和支付向量,子博弈,条件1说的是一个子博弈必需从一个单结信息集开始。即
35、:(1)当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的开始。(2)如果一个信息集包含两个以上决策结,没有任何一个决策结可以作为子博弈的初始结。,条件2说的是,子博弈的信息集和支付向量都直接继承自原博弈,并不会发生任何变化。 这意味着子博弈不能分割原博弈的信息集。,逆向归纳法p157,逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。,子博弈精炼纳什均衡p166,扩展式博弈的战略组合s*=(s1*,si*,sn*)是一个子博弈精炼纳什均衡,如果: (1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什
36、均衡。 一个战略组合是个子博弈精炼纳什均衡,当只当它在每一个子博弈上都构成一个纳什均衡,子博弈精炼纳什均衡,均衡路径 构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别 只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略 序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策,2.4子博弈精炼纳什均衡应用举例,斯坦克尔伯格(Stackelberg)寡头竞争模型 劳资博弈 讨价还价博弈,Stackelberg寡头竞争模型,一个市场上只有两个企业,他们的行动都是
37、选择产量,但行动有先后顺序。企业1(领头企业,Leader)首先选择产量q10;企业2(尾随企业,Follower)观测到q1,然后选择自己的产量q2 0。 设总产量Qq1+q2,两个企业有相同的不变单位成本c 0,需求函数 P(Q)=a-Q=a-(q1+q2)。 问题:两个企业应如何决策?,库诺特模型与斯氏模型比较,库诺特模型均衡结果: q1*=q2*=1/3(a-c) q1*+q2*=2/3(a-c) 1*= 2*=1/9(a-c)2,斯氏模型均衡结果: q1*=1/2(a-c) q2*=1/4(a-c) q1*+q2*=3/4(a-c) 1*=1/8(a-c)2 2*=1/16(a-c)
38、2,张教材185页图,劳资博弈,工会决定工资水平,但企业决定雇用多少人。 工会不只追求高工资,还希望被雇人数多。不喜欢高工资高失业,也不喜欢低工资低失业。工会方的效用是工资水平和雇用人数两者的函数u=u(w,L)。工会的目标是最大化总效用 假设收益是劳动雇用量的函数R(L)(边际效益递减),再假设只有劳动成本,工厂的利润函数为(w,L)R(L)- wL,讨价还价博弈(1)谢识予p145,假设有甲乙两人就如何分割1万元进行谈判,并且已定下了如下规则: 首先,由甲提出一个分割比例,对此,乙可以接受也可以拒绝;如果乙拒绝,则乙自己应提出另一个方案,让甲选择接受与否。如此循环。 在循环中,只要有任何一
39、方接受对方的方案博弈就告结束,而如果方案被拒绝,则被拒绝的方案与以后的讨价还价过程不再有关系。,讨价还价博弈(2),每次一方提出一个方案和另一方选择是否接受为一个阶段。再假设讨价还价每多进行一个阶段,由于谈判费用和利息损失等,双方的得益都要打一次折扣,折扣率为, 01,称为消耗系数。 如果限制讨价还价最多只能进行三个阶段,到第三阶段乙必须接受甲的方案,这就是一个三阶段讨价还价博弈。,接受 不接受,出S乙必须接受,讨价还价博弈(3),甲,出S1,乙,接受 不接受,出S2,甲,(S1, 10000-S1),S2, (10000-S2) 2S, 2(10000-S),第一阶段 第二阶段 第三阶段,2
40、.5 重复博弈和无名氏定理,序贯博弈:不同阶段的博弈结构不同 重复博弈:同样结构的博弈重复多次,其中的每次博弈可称“阶段博弈” 影响重复博弈均衡结果有二,其一:博弈重复次数。多次博弈可能使参与人选择“合作” 影响重复博弈均衡结果之二:信息的完备性。当一个人的支付函数(包括行动和结果)不为其他人所知时,他可能有积极性选择“合作”策略从而建立“好”声誉以换取长期利益,2.5.1 有限次重复博弈:连锁店悖论,市场的“先来后到”重复博弈中,在位者在第一次选择“斗争”时不可置信的威胁。惟一的子博弈精炼纳什均衡是他总是“默许”。 倒着想:如果已经进入了n-1个,在最后一个时,其威胁本来是不可置信的,则最后
41、一个会“默许”,再往前推,由于每阶段的“斗争”都是不可置信的,则所有大门都在“默许”下向后来者敞开 悖论:我n大的市场岂容你染指?斗!但事实不会如此 只要博弈的重复次数是有限的,“重复”并不改变囚徒困境的结果。,2.5.2 无限次重复博弈和无名氏定理,解开连锁店难题的办法之一是引入信息的不完全性。(不确定性可以成为经济运行的资源) 当博弈重复无限次时,存在着完全不同与一次博弈的子博弈精炼纳什均衡 冷酷战略或触发战略:只要你骗我一次/背叛,我永远不理你/不合作。 无名氏定理:有一个一次博弈G可作为某无穷博弈的一个阶段,G有纳什均衡及其结果,对于无限博弈,肯定存在一个贴现因子,使无限博弈的结果不劣
42、(弱优)于G的纳什均衡结果,2.5.3 参与人不固定的重复博弈,重复博弈时,厂商不敢以劣货欺人 在经济学或管理学中使用“信誉”这样一个不好解释的概念,但在博弈论中却在某些假设之下“逻辑地”证明了。所谓“信誉”,无非对自己行为的预期 为什么买于“坐贾”而非“行商”?为什么车站旁边的劣质品那么多? 企业存在的一个原因是创造一个“长期参与人”,因其考虑长期利益而遵章守纪、态度积极,2.5.4 不确定环境下的重复博弈,寡头市场上,低需求时容易使他们都选择“合作”,但在高需求时,利润的诱惑使他们都选择“背叛”。这种情况可以重复 能同甘却不能共苦,似乎有道德谴责的意味,但这一现象总是发生,发生的逻辑是什么
43、?博弈论可以解释,3 不完全信息静态博弈,3.1 不完全信息博弈 在信息上,各对手有时势均力敌,可能形成完全信息博弈 其技术标准是:支付函数是共同知识 大量的对局中信息不对称,如 古董(他们坐店收购时从来不先出价,卖猫的故事) 企业选择员工 保险销售 至少有一个人不知道其他人的支付函数,即形成“不完全信息博弈”,3.1 不完全信息博弈和贝叶斯纳什均衡,3.1.1 不完全信息博弈 例:市场进入博弈 进入者不知道在位者的成本函数,只能猜概率 如果你是高成本,我就进入,预期收益40,如果你是低成本,我就不进入。到底进还是不进?,期望利润:p40+(1-p)(-10).为保证不亏,期望利润为0, 则p
44、=0.2。大于0.2会赚钱。对p的判断就是“贝叶斯理念”,3.1 不完全信息博弈和贝叶斯纳什均衡,3.1.2 海萨尼转换 引入一个“自然”,尼不知道别人的类型,但“自然”已经选择好了。 这时,“不完全”信息转换成“完全”信息,因为可以藉此展开分析 246页图,有了概率(似乎是个代数符号),就可以运算了 注意进入者的信息集。把未知的东西化为“非空有限集”(集合也同时意味着分布概率),则在理论上可知 海萨尼转换已成为处理不完全信息博弈的标准方法 通过海萨尼转换,博弈开始时,所有参与人对“自然”的行动有一致的信念,即都知道所有参与人类型的概率分布函数。此即“海萨尼公理”,3.1.3 不完全信息静态博
45、弈的战略式表述和贝叶斯纳什均衡 贝叶斯纳什均衡是完全信息静态博弈纳什均衡在不完全信息上的扩展,不完全信息博弈又称“静态贝叶斯博弈” 与完全信息静态博弈不同的是:参与人的行动空间可能依赖于他的类型 静态贝叶斯博弈的战略式表述包括:战略空间、类型的表现、概率、支付函数 静态贝叶斯博弈的时间顺序:“自然”选择各人的类型(参与人只知道别人的概率分布);各参与人同时选择相对,每个人各得其所 如果各参与人的类型空间只有一个元素,则退化为完全信息静态博弈,3.1 不完全信息博弈和贝叶斯纳什均衡,贝叶斯纳什均衡的定义 如果我是某种类型则其他人属某类型的概率,乘以这种情况下其他人的最好选择时我所得到的效用。对此
46、乘积加总,找出我的最大效用 贝叶斯均衡相当于“各人的类型之和”个参与人的纳什均衡,3.1 不完全信息博弈和贝叶斯纳什均衡,3.2.1 不完全信息古诺模型 前面已经分析过完全信息静态古诺模型p74和动态斯坦克尔伯格模型p182。后者,由于先行者的优势而使均衡结果不同于完全信息下的结果(如果是选择价格,均衡结果不利于先行者),3.2 贝叶斯纳什均衡的应用举例,3.2.3 双方叫价拍卖double auction 两群人各自出价,有中间的拍卖商。 叫价较低者容易卖出,但成交价格有可能高于他的出价;出价高者容易买到,但成交价格有可能低于他的出价 Chatterjee & Samuelson “双方叫价
47、拍卖模型” 假设你卖我买 你觉得这东西值c,要价ps;我觉得这东西值v,要价pb。同时报数 如果你要价较低,成交,价格为中间数 如果你要价较高,不成交,3.2 贝叶斯纳什均衡的应用举例,3.2 贝叶斯纳什均衡的应用举例,3.2.3 双方叫价拍卖double auction 如果是完全信息,我知道那东西对你意味着什么,你也知道那东西对我来讲值多少钱。 这将形成一个均衡:你我出价相等,皆大欢喜 如果谁想沾便宜,生意就没法做 还可能出现无效率的均衡:双方都没有认真选择价格,漫天要价,坐地还钱,做不成生意,3.2 贝叶斯纳什均衡的应用举例,3.2.3 双方叫价拍卖double auction 如果是不
48、完全信息,我不知道那东西对你意味着多少钱,你也不知道那东西对我来讲有多大价值。但可以假设我们互相知道对方的分布函数 根据纳什均衡的定义,我们都选择最大化 根据均衡战略,即使我觉得它值1,但我最多只出3/4,如果想成交,你的要价必须不高于3/4,3.3 贝叶斯博弈与混合战略均衡,完全信息混合战略均衡可视为不完全信息纯战略均衡的极限 混合战略均衡的纯化定理,3.4 机制设计理论与显示原理,3.4.1贝叶斯博弈和机制设计 3.4.2 拍卖机制设计 3.4.3机制设计和显示原理 3.4.4 不完全信息与资源配置,有同时选择的两阶段动态博弈谢识予p163,假设有两个阶段,在每个阶段有两个参与人同时选择(
49、静态博弈)。此时,子博弈是第二阶段两参与人的同时选择。,银行挤兑(1) 王则柯“银行挤兑的成因和预防”,两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。,对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。 假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。 如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。,银行挤兑(2),银行挤兑(3),2.5 完全但不完美信息动态博弈 谢识予276,二手车交易 精炼贝叶斯均衡 市场类型 混同均衡与分离均衡 单一价格二手车交易,