1、 经 济 博 弈 论 复 习 精 要一 题型分值:1名词解释:4 分* 5 = 20 分; 2.判断题:2 分* 10 = 20 分;3.简答题:7 分*3=21 分; 4.计算题:9 分*1+10 分*3=39 分.二.名词解释(4 分* 5 = 20 分,5 题,共 20 题)1.博弈:指策略对抗,或策略有关键作用的游戏;博弈即一些个人、队组或其它组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。2. 博弈论(Game Theory):指系统研究各种各样博弈中参与人的合理选择及其均衡的理论,该理论思想的
2、主要特征是博弈中各参与人的策略和得益相互依存、相互依赖。3. 策略:博弈中各博弈方的选择内容(每个博弈方可选策略不一定完全相同,即不一定对称)4. 得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会效益、福利等,有效用,有损失)5. 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。6. 严格下策:不管其它博弈方策略如何变化,给一个博弈方带来的收益总是比另一策略给他带来收益小的策略。 (严格下策反复消去法)7. 划线法:指用策略之间的相对优劣关系,而不是绝对优劣关系来进行博弈选择以求纳什均衡的方法。 (划线法的思路是先找出每个博弈方
3、针对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,即纳什均衡)8. 纳什均衡:使每个参与人的策略是对其他参与人策略的最优反应的策略组合。9. 反应函数:指一博弈方对另一博弈方每种可能的决策内容的最佳反应决策所构成的函数。10. 帕累托上策均衡:指多重纳什均衡中给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益的那个纳什均衡。11. 风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,能给博弈方带来最大期望得益,且被各博弈方偏爱策略组合。12. 逆推归纳法:指从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个
4、阶段相应博弈方的行为选择,一直到第一个阶段的分析方法。13. 子博弈:指由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈部分。14. 子博弈完美纳什均衡:指如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡。15. 重复博弈:指基本博弈重复进行构成的博弈过程。 (无限,有限次重复博弈)无限次重复博弈:一个基本博弈 G 一直重复博弈下去的博弈,记为 G( );16. 触发策略:指两博弈方先试探合作,一旦发现对方不合作则也用不合作报复的策略。17.有限次有限次
5、重复博弈民间定理:设原博弈的一次性博弈有均衡得益数组优于 w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。18.最优反应动态:指少数有快速学习能力的有限理性博弈方之间的反复博弈和策略进化调整的动态机制。19. 复制动态: 指学习速度很慢成员组成的大群体随机配对的反复博弈和策略进化调整的动态机制。20. 进化稳定策略(ESS): 指群体的大部分成员所采取的某种策略。三简答题(7 分*3=21 分,3 题,共 15 题)1.设定一个博弈模型必须确定哪几个方面?(简答热点)答:博弈模型方面:(1)博弈方;(2)策略(空间) ,
6、即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。2.博弈有哪些结构内容分类方法,有哪些主要的类型?(简答热点)答:根据博弈方行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类; 根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理),(),(1,(),(11 niini nxGi exeG
7、均 得 益 为什 均 衡 , 各 博 弈 方 的 平 完 美 纳中 一 定 存 在 一 个 子 博 弈次 重 复 博 弈 , 那 么 无 限足 够 接 近都 成 立 , 而对 任 意 博 弈 方 果的 任 意 可 实 现 得 益 。 如表 示用 的 纳 什 均 衡 的 得 益 ,记的 静 态 博 弈 。 用 是 一 个 完 全 信 息理 : 设无 限 次 重 复 博 弈 民 间 定性博弈就是进化博弈;根据博弈过程分为静态博弈、动态博宑和重复博弈三大类;根据博弈问题的信息结构,博弈方是否都有关于得益和博弈过程充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美
8、信息动态博弈和不完全信息动态博弈几类; ( 根据得益的特征分为零和博弈、常和博弈和变和博弈;根据博弈中博弈方的数量可将博弈分为单人博弈、两人博弈和多人博弈;根据博弈方策略的数量;分为有限博弈和无限博弈两类。)3.有限次重复博弈和无限次重复博弈有何区别?这些区别对我们有什么启发?(简答热点)答:从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结束时间,或者较长期的关系。从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即
9、根据特定效率意义等构造子博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在无限次重复博弈问题中这是必须考虑的。上述区别在理论方面对我们最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方
10、面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。- - - - - - - - - - - - - - - - - - - - - - - - - 4.“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。答:“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单地说“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。 现实中“囚徒的困境”类型的问题是很多的,例如厂商之间的价格战、恶性的广告竞争,初等、中等教育中的应试
11、教育等,其实都是“囚徒的困境”博弈的表现形式。5.什么是博弈?博弈论的主要研究内容是什么?答:博弈:博弈就是策略对抗,或策略有关键作用的游戏。博弈即一些个人、队组或其他组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。一个博弈必须包含博弈方、策略空间、博弈的次序和得益(函数)这几个基本的方面,信息结构、博弈方的行为逻辑和理性层次等,其实也是博弈问题隐含或者需要明确的内容。博弈论:系统研究各种各样博弈中参与人的合理选择及其均衡的理论。 (该理论思想的主要特征是博弈中各参与人的策略和得益相互依存、相互依赖)6.
12、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么?答:上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是各博弈方相对最优策略的组合。因此上策均衡是比纳什均衡要求更高,更严格的均衡概念,上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡。对于同一个博弈来说,上策均衡的集合是纳什均衡集合的子集,但不一定是真子集。严格下策反复消去法与上策均衡分别对应两种有一定相对性的决策分析思路:严格下策反复消去法对应排除法,即排除绝对最差策略的分析方法;上策均衡对应选择法,即选择绝对最优策略的均衡概念。严格下策反复消去法和上策均衡之间并不矛盾,甚至可以相互补充,因为严格下策反复消去法不会消去任何上策均
13、衡,但却可以简化博弈。严格下策反复消去法与纳什均衡也是相容和补充的,因为严格下策反复消去法把严格下策消去时不会消去纳什均衡,但却能简化博弈,使纳什均衡分析更加容易7.为什么说纳什均衡是傅弈分析中最重要的概念?答:之所以说纳什均衡是博弈分析(非合作博弈分析)最重要的概念,主要原因是纳什均衡与其他博弈分析概念和分析方法相比,具有两方面的优秀性质:第一是一致预测性质,一致预测性是纳什均衡的本质属性;第二是普遍存在性。纳什均衡是惟一同时具有上述两大性质的博弈分析概念,而且它也是其他各种博弈分析方法和均衡概念的基础,因此纳什均衡是博弈分析中最重要、作用最大的概念。8.找出现实经济或生活中可以用帕累托上策
14、均衡、风险上策均衡分析的例子。答:帕累托上策均衡通常在分析存在多重纳什均衡,不同纳什均衡之间有优劣关系的博弈问题时有用,因此适合用来讨论现实中我们常说的共赢、多赢可能性或者条件等。例如两个企业之间的技术、投资合作,劳资关系,或者两个国家之间政治、军事和外交冲突等往往都可以用帕累托上策均衡槪念进行分析。风险上策均衡通常是在有一定不确定性,而且不确定性主要来源于客观因素、环境因素的博弈间题。例如人们对就业行业和职业的选择,人们在银行存款和股市投资之间的选择,以及投资和产品、技术开发方面的决策等问题都可以用风险上策均衡概念进行分析。9.多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不
15、利影响?答:多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各个博弈方有一致的预测,而是指每个博弈方自己的策略选择与自己的预测一致。对博弈分析主要的不利影响是,当博弈存在多重纳什均衡,而且相互之间没有明确的优劣之分时,会造成预测分析的困难,影响以纳什均衡为核心的博弈分析的预测能力。存在帕累托上策均衡、风险上策均衡、聚点均衡或相关均衡的可能性,并且博弈方相互之间有足够的默契和理解时,多重纳什均衡造成的不利影响会较小。10.博弈求解法:上策均衡;严格下策反复消去法;划线法;箭头法;反应函数法。11.动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是什么关系?答:子博弈
16、完美纳什均衡即动态博弈中具有这样特征的策略组合:它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于,动态博弈中各个博弃方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能在博弈过程中改变均衡策略设定的行为,从而使得均衡策略存在可信性问题,而且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一个子集。12.导论中图 1.12 的先来后到博弈中有几个纳什均衡,子博弈完美
17、纳什均衡是什么?导论中图 1.12 的先来后到博弈的扩展形表示如下:根据纳什均衡的定义,不难判断(打进,和平)和(不进,打击)是本博弈的两个纳什均衡,因为这两个策略组合都满足这一条件:任一方单独改变策略不可能增加利益,相反却可能损害自己的利益。运用逆推归纳法不难找出, (打进,和平)是本博弈惟一的子博弈完美纳什均衡,而(不进,打击)不是子博弈完美纳什均衡,因为 A 针对 B 打进的打击是不可信的威胁。13.博弈方理性问题对动态博弈分析的影响是否比对静态博弈分析影响更大?为什么?答:博弈方的理性问题对动态博弈分析的影响肯定比对静态博弈分析的影响更大。虽然博弈方的理性问题,博弈方实际理性与博弈分析
18、假设的有差距,对博弈分析的影响在静态博弈分析中也存在,教材第二章多次提到了这个问题,但博弈方的理性问题对动态博弈分析的影响肯定更大。因为以子博弈完美纳什均衡和逆推归纳法为核心的动态博弈分析,对博弈方理性的要求比静态博弈的纳什均衡分析的更高,而且博弈方理性的缺陷还会引出理性判断的动态调整等更复杂的问题。例如某个博弈方由于理性问题在某时刻“犯错误” ,采用偏离子博弈完美纳什均衡的行为、路径,这时候后面阶段行为博弈方的判断和行为选择就会有困难。这种困难是动态博弈所特有的,在静态博弈分析中并不存在。14.如果 T 次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?答:齐威王田忌赛马博
19、弈是只有混合策略纳什均衡的严格竞争零和博弈,对一方有利的策略组合总是对另一方不利,没有一个策略组合双方同时愿意接受。根据关于两人零和博弈有限次重复博弈的结论次重复该博弈时双方的策略是每次都采用原博弈的混合策略,即都以 1/6 的相同概率在各自的六个可选策略中随机选择。这就是该重复博弈惟一的子博弈完美纳什均衡。期望平均得益仍然是齐王 1,田忌-1。15.若三次重复 2.3.1 的古诺模型,子博弈完美纳什均衡是什么?答:古诺模型是一个典型的囚徒的困境型博弈,有惟一的纯策略纳什均衡。根据关于有惟一策略纳什均衡的有限次重复博弈的定理,这个三次重复博弈的子博弈完美纳什均衡是,两个厂商在每次重复时都会釆用
20、一次性博弈的纳什均衡,也就是 2 单位的古诺产量。四.计算题(9 分*1+10 分*3=39 分,4 题,共 12 题)1.两次重复得益矩阵表示的静态博弈。如果你是博弈方 1,你会采用怎样的策略。 (作业题)用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和 (M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。作为博弈方 1 会采用这样的触发策略:第一次重复采用 B;第二次重复时,如果前一次的
21、结果是(B,S),则采用 M,如果前一次的结果是其他,则采用 T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用 S;第二次重复时,如果前一次的结果是(B,S),则采用 R,否则采用 L。双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了
22、进一步的支持。2.分析下列得益矩阵表示博弈的最优反应动态的策略稳定性,假设:(a)群体中有 4 个博弈方,沿一圆周分布,各自对相邻博弈方的前期策略作最优反应;(b)群体中有 4 个博弈方,各个博弈方对所有博弈方的上期策略作最优反应。 (作业题)(a)先分析博弈方根据最优反应动态调整策略的规则。设 t 时期博弈方 i 的邻居中采用 A 策略的数量为,采用 B 策略的数量为,其中只能取 0、1、2,那么只有在博弈方采用 A 的得益大于采用 B 的得益:即时,博弈 i 在 t+1 时期会采用 A,否则会采用 B。由于只能取 0、1、2 三个数值,因此只要博弈方 i 的两个邻居中有 1 个在 t 时期
23、采用 A,博弈方 i 在 t+1 时期就会采用 A,如果两个邻居一个都没有釆用 A,博弈方 i 在 t+1 时期应采用 B。这对 4 个博弈方都适用。该博弈中博弈方采用不同策略的初始情况总共有种可能性。根据上述策略调整规则,初始都采用 A 或 B 的不会变化;有 3 个 A 的四种情况,有相邻 2 个 A 的四种情况,都会收敛到所有博弈方都采用 A;有分隔 2 个 A 的两种情况,以及只有 1 个 A 的四种情况,动态系统会反复循环而不会收敛。(b)这部分请读者自己练习。提示:先设 t 时期博弈方 i 以外的三个博弈方中采用 A 策略的数量为,然后根据 t 时期采用两种策略得益的大小确定选择策
24、略的标准,再根据该标准讨论不同初始情况的进化博弈结果。3.你正在考虑是否投资 100 万元开设一家饭店。假设情况是这样的:你决定开,则 0. 35的概率你将收益 300 万元(包括投资) ,而 0.65 的概率你将全部亏损掉;如果你不开,则你能保住本钱但也不会有利润。请你(a)用得益矩阵和扩展形表示该博弈。 (b)如果你是风险中性的,你会怎样选择?(c)如果成功概率降到 0.3,你怎样选择?(d)如果你是风险规避的,且期望得益的折扣系数为 0.9,你的策略选择是什么?(e)如果你是凤险偏好的,期望得益折算系数为 1.2,你的选择又是什么?(a)根据问题的假设,该博弈的得益矩阵和扩展形表示分别如
25、下:(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较:0. 35 X 300 + 0. 65 X 0 = 105 100,肯定会选择开。(c)如果成功的概率降低到 0.3,那么因为这时候开的期望收益与不开的收益比较:0. 30 X 300 + 0. 70 X 0 = 90 100,因此这时候肯定会选择开。4下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么?首先,运用严格下策反复消去法的思想,不难发现在博宑方 1 的策略中,B 是相对于T 的严格下策,因此可以把该策略从博弈方 1 的策略空间中消去。把博弈方 1 的 B 策略消去后又可以发现
26、,博弈方 2 的策略中 C 是相对于 R 的严格下策,从而也可以消去。在下面的得益矩阵中相应策略和得益处划水平线和垂直线表示消去了这些策略。两个博弈方各消去一个策略后的博弈是如下的两人 2 X 2 博弈,已经不存在任何严格下策。再运用划线法或箭头法,很容易发现这个 2 X 2 博弈有两个纯策略纳什均衡(M, L)和(T,R)。由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,双方利益有不一致性,因此如果没有其他进一步的信息或者决策机制,一次性静态博弈的结果不能肯定。由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可能是 4 个纯策略组合中的任何一个。5.求出下图中得益矩阵所表
27、示的博弈中的混合策略纳什均衡。根据计算混合策略纳什均衡的一般方法,设博弈方 1 采用 T 策略的概率为 p,则采 B策略的概率为 1-p,再设博弈方 2 采用策略 L 的概率为 q,那么采用策略 R 的概率是 1-q,根据上述概率分别计算两个博弈方采中各自两个纯策略的期望得益,并令它们相等:解上述两个方程,即该博弈的混合策略纳什均衡为:博弈方 1 以概率分布 2/3 和 1/3在 T 和 B 中随机选择;博弈方 2 以概率分 3/4 和 1/4 在 L 和 R 中随机选择。6.博弈方 1 和博弈方 2 就如何分 10 000 万元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额和
28、, 。如果,则两博弈方的要求都得到满足,即分别得和,但如果,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?我们用反应函数法来分析这个博弈。先讨论博弈方 1 的选择。根据问题的假设,如果博弈方 2 选择金额,则博弈方 1 选择的利益为:因此博弈方 1 采用时,能实现自己的最大利益。因此就是博弈方 1 的反应函数。博弈方 2 与博弈方 1 的利益函数和策略选择是完全相似的,因此对博弈方 1 所选择的任意金额,博弈方 2 的最优反应策略,也就是反应函数显然,上述博弈方 1 的反应函数与博弈方 2 的反应函数是完全重合的,因此本博弈有无穷多个纳什均
29、衡,所有满足该反应函数,也就是的数组都是本博弈的纯策略纳什均衡。如果我是两个博弈方中的-个,那么我会要求得到 5 000 元。 理由是在该博弈的无穷多个纯策略纳什均衡中, (5 000, 5 000)既是比较公平和容易被双方接受的,也是容易被双方同时想到的一个,因此是一个聚点均衡。7.甲、乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元) 。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有 什么好的方法?(1)用划线法(常用)或箭头法等不难找出本博弈的两个纯策略纳什均衡(开发,不开发)和(不开发,开发) ,即甲乙两个公司中只有一家公司开发
30、是纳什均衡,而两家公司都开发或都不开发不是纳什均衡。此外该博弈还冇一个混合策略纳什均衡。根据混合策略纳什均衡的计算方法,不难算出本博弈的混合策略纳什均衡是两个公司都以的概率分布随机选择开发或不开发。本博弈的两个纯策略纳什均衡前一个对甲有利,后一个对乙有利。混合策略纳什均衡也并不是好的选择,因为结果除了仍然最多是对一方有利的纯策略纳什均衡以外,还可能出现大家不开发浪费了机会,或者大家开发撞车的可能。(2)根据上述分析我们知道,如果没有其他因素的影响,该博弈的两个博弈方谁都无法保证博弈结果有利于自己。乙公司所在国政府可能保护本国公司利益,促使博弈结果有利于本国乙公司途径,是设法改变上述博弈的利益结
31、枸,从而促使有利于本国乙公司的均衡出现。政府改变博弈得益结构的有效方法是对本国公司的开发活动进行补贴。例如若乙公司所在国政府对乙公司开发活动提供 20 单位(百万美元) 财政补贴,则该博弈的得益矩阵转变为不难发现乙公司所在国政府对乙公司开发活动的补贴,已经使得开发变成乙公司相对于不开发的严格上策,即使甲公司选择开发,乙公司选择开发也比选择不开发更有利,因此乙公司此时的惟一选择是开发。根据上述得益矩阵,甲公司完全可以判断出乙公司的选择,甲公司只能选择不开发,因此现在该博弈惟一的纳什均衡是(不开发,开发)结果是乙公司可以保证获得 120 单位的利润。虽然乙公司所在国政府为此付出了 20 单位的代价
32、,但这显然是值得的。如果乙公司所在国政府能从乙公司的利润中获得 20 单位或以上的税收或其他利益,那么政府最终也没有损失甚至还能获利。这正是现代世界各国政府对本国企业的国际竞争进行补贴的主要理论根据。8.运用均衡概念和思想讨论下列得益矩阵表示的静态博弈。解答提示:在纳什均衡分析的基础上,再进一步考虑运用其他均衡概念或分析方法,如风险上策均衡等进行分析。首先,很容易根据划线法等找出本博弈的两个纯策略纳什均衡(U,R)和(D,L) 。本博弈还有一个混合策略纳什均衡,即两博弈方备自以 2/3、1/3 的概率在自己的两个策略U、D 和 L、R 中随机选择。但本博弈的两个纯策略纳什均衡中没有帕累托上策均
33、衡,两个博弈方各偏好其中一个,而且另一个策略组合(U, L)从整体利益角度优于这两个纯策略纳什均衡,因此博弈方很难在两个纯策略纳什均衡的选择上达成共识。混合策略纳什均衡的效率也不是很高,因为有一定概率会出现(D,R)的结果。根据风险上策均衡的思想进行分析,当两个博弈方各自的两种策略都有一半可能性被选到时,本博弈的两个纯策略纳什均衡都不是风险上策均衡,而策略组合(U, L)却是风险上策均衡。因为此时博弈方 1 选择 U 的期望得益是 4,选择 D 的期望得益是 3.5,博弈方 2 选择 L 的期望得益是 4,选择 R 的期望得益是 3.5。 因此当两个博弈方考虑到上述风险因素时,他们的选择将是(
34、U, L),结果反而比较理想。 (如果博弈问题的基本背景支持,对本博弈还可以用相关均衡的思想进行分析。读者可自己作一些讨论。 )9.如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中 a、b 的数值不确定。试讨论本博弈有哪几种可能的结果。如果要本博弈中的“威胁”和“承诺”是可信的,a 或 b 应满足什么条件?括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以 a 表示乙的得益,而 b 表示甲的得益。根据分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(l)a 2,此时博弈的结果仍然是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3) a 1 且 b
35、 2,此时博弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b) (4)a 0 且 b 0。要本博弈的“承诺” ,即“分”是可信的,条件是 a 0 且 b 2。 (注意上面的讨论中没有考虑 a = 0,a = 0,,b = 2 的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测,不过最终的结果并不会超出上面给出的范围。 )10.三寡头市场需求函数 P=100-Q,其中 Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本 2 而无固定成本。如果厂商 1 和厂商 2 先同时决定产量,厂商 3 根据厂商 1和广商 2 的产最决策,问它
36、们各自的产量和利润是多少?首先,设三个厂商的产量分别为和,三个厂商的利润函数为:根据逆推归纳法,先分析第二阶段是厂商 3 的选择。将厂商 3 的利润函数对其产量求偏导数并令其为 0 得:因此厂商 3 的反应函数为:再分析第一阶段是厂商 1 和厂商 2 的决策。先把厂商 3 的反应函数代入厂商 1 和厂商 2 的利润函数得:分别对和由求偏导数并令为 0 得:联立两个方程可解得。再代入厂商 3 的反应函数得。把三个厂商的产量代入各自的利润函数,可得三个厂商的利润分别为 4 802/9、4 802/9 和 2 401/9。11.求出下列得益矩阵表示的静态博弈的纳什均衡,并说明有限次和无限次重复该博弈
37、时两博弈方的均衡策略。首先很容易看出,博弈方 1 的 D 策相对于 T 策和 M 策都是严格下策,因此可以消去。消去博弈方 1 的 D 策后四个策略组合中不存在纯策略纳什均衡。根据混合策略纳什均衡的计算方法,不难算出混合策略纳什均衡为:博弈方 1 以概率分布(1/2,1/2)在 T 和 M 中随机选择,博弈方 2 则以概率分布(1/3,2/3)在 L 和 R 中随机选择。由于上述静态博弈是没有纯策略纳什均衡的严格竞争博弈,因此在有限次重复博弈和无限次重复博弈中,两博弈方的均衡策略都是简单重复原博弈的混合策略纳什均衡。12.分析上一题中博弈的大群体复制动态进化稳定策略(ESS)。说明分析结果所隐
38、含的现实意义。 (知识点:复制动态微分方程,动态相位图)上一题博弈是 2 X 2 对称博弈。设群体成员采用 A 策略的比例为 x,根据两人 2 X 2对称博弈复制动态的一般公式,x 的复制动态方程为:该复制动态方程有三个稳定状态和,其中和是 ESS。当初始时复制动态会收敛到,即所有博弈方都采用策略 B;当初始的时复制动态将收敛到,即所有博弈方都采用策略 A。上述复制动态进化博弈的结论,说明在这种协调博弈类型的博弈问题中,长期中反复的实践、学习和策略调整,总是可以使博弈方最终默契于不一定最理想,但至少有合理性的均衡策略组合之一,效率很差的非纳什均衡纯策略组合,或者碰运气的混合策略都会被淘汰。初始策略比例不同可能收敛于不同 ESS 的结论,对于经济管理思路有重要启发作用。