201512 《博弈与决策》期末复习资料2015-12.doc-道客多多

资源描述

1、1博弈与决策期末复习资料一、期末考试形式和时间半开卷时间：90 分钟二、考试题型1、名词解释（每小题 5 分，共 20 分）；2、简答题 (每小题 10 分，共 30 分)；3、论述题（每小题 15 分，共 30 分）；4、案例分析题（共 20 分）参考复习资料如下：三、名词解释1.信号传递：在信息经济学里，具有优势的一方（拥有私人信息的一方）采取某种行动向信息劣势一方（不了解对方私人信息的一方）发送相关信号，来告诉对方自己的真实类型。2非合作博弈：是指参与人之间没有一个对各方具有约束力的协议，参与人不在协议范围内进行的博弈。3重复博弈：是指同一个博弈在相同的环境、规则下反复多次执行

2、的博弈问题。4第一价格密封拍卖：在这种拍卖模式下，投标者利用秘密方式（比如将报价写好装入一个信封）同时投标，所有的投标人都不知道其他投标人的出价，且一旦呈交了投标就没有机会更新。拍卖人当众打开这些信封，出价最高者就是赢者，可以以其所报出的最高价格购买被拍卖物品。5.静态博弈：是指在博弈中，参与人同时选择或虽非同时选择单后行动者并不知道先行动者采取了什么具体行动。6. 逆向归纳法：就是从最后一个阶段或最后一个子博弈开始逆推上去，逐步向前倒推以求解动态博弈均衡。7精炼叶贝斯纳什均衡：在不完全信息动态博弈下，如果给定参与者自己的特征和其他参与者特征概率分布的情况下，每个参与者选择的策略能使自己的期望

3、支付达到最大化，也就是没有人积极选择其他策略，这就形成了“精炼贝叶斯纳什均衡” 。8第二价格密封拍卖：每个竞标者分别向拍卖方提交自己的报价，而且他们不知道别人的出价，出价最高的竞标者将获得物品，并按所有的出价中仅次于最高出价的第二高价格支付给卖家。9.不完全信息：是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数信息了解的不够或者不是对所有参与人的特征策略空间及收益函数都有准确的信息。10.子博弈：是指它本身可以作为一个独立的博弈进行分析，它是原博弈的一部分。任何博弈本身可被称为自身的一个子博弈。11.完美信息：某个参与人行动前，有足够的信息来确定已经行动的参与人选择了什么行

4、动，这种信息结构称为完美信息。12.贝叶斯纳什均衡：在给定自己类型以及给定其他参与者的类型与策略选择之间关系的条件下，使自己的棋王小勇最大化，这时形成的一个纳什均衡，就称为“贝叶斯纳什均衡” 。13.参与人：指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)；14.占优战略均衡：占优战略均衡是指在博弈中，如果所有参与人都有占优战略存在，博弈将在所有参与人占优战略的基础上达到均衡。15.行动：行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。216.动态博弈：动态博弈是指在博弈中，参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。17.劣策略：在博

5、弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中对自己严格不利的策略。18.信息集：是指某一参与人在某一阶段的行动时由博弈历史信息反映的那一组都有可能是真实位置的决策结的集合。19.得益：得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西。20.纳什战略均衡：纳什战略均衡是指在均衡中，每个博弈参与人都确信，在给定其他参与人战略决定的情况下，该参与人选择了最优战略以回应对手的战略。21.博弈论：博弈论就是系统的研究各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，并对这些解进行讨论分析的理论。22.纳什均衡：当博弈的

6、所有参与者在某一选定的策略组合下都没有动机（单方面）偏离各自己选定的策略时，该策略组合就构成一个纳什均衡。即给定其他参与者的策略。每一个参与者的这个策略能十七期望效用最大化。四、简答题1.什么是重复博弈中的“针锋相对”策略？（1）重复博弈中的“针锋相对”策略，其实就是说，如果博弈参与者第一步采取合作，此后每一步都重复对方上一步的行动，要么是合作要么是背判，只要博弈没有确切的期限，由于长期利益对短期行为的制约作用，因此有一些在一次性博弈中不可行的威胁或者承诺在重复博弈中会变得可信，那么就会形成一种持续合作的态势。（ 5 分）（2）比如在囚徒困境中，在第一局中，你采取合作不坦白的策略。在以后的

7、每一局中，如果你的对手在上一局中采取背叛的策略，那么你也采取背叛的策略；如果你的对手在上一局中采取合作的策略，那么你也采取合作的策略。结果发现这是一种最好的策略。针锋相对的策略的确非常令人满意，它能立即对背叛者施以惩罚。（ 5 分）2.简述混合策略的含义及如何正确选择混合策略。（1）混合策略的含义为：若果在每个给定信息下，参与者只能以某种概率选择不同的策略，换句话说，不是参与者纯粹地选择什么策略，而是随机的，或者以百分之多少的概率选择不同的策略。（2）正确选择混合策略，要注意以下几点：避免在随机中有规律性。不要依赖对手的随机性。做一个独一无二的自己。先发制人以便抢占先机。虚虚实实以便出人意

8、料。3.什么是逆向选择？逆向选择在银行贷款上是如何体现的？（1）逆向选择是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降的现象。（2）在银行信贷中有两类借款人：一类“高质量带狂人” ，一类“低质量贷款人” ，但是由于银行根据寄款人提供的有限信息不能够完全判断出借款人的真实状况，银行只好给出一个平均的贷款利率水平。这一利率对于高质量借款人而言贷款成本和贷款压力显得高，就会让他们退出信贷市场。而对于低质量借款人而言，如果项目失败了，也就偿还一点银行的贷款，如果项目成功，收益可观，也就不在乎这点利息，而由于银行无法分辨项目的风险高低。所以关心利率高低的

9、借款人是信用质量高的人，而与其会违约的借款人不会在意较高的利率，所以利率的上升会使得地方先的投资项目和高质量的借款人退出市场，贷款的质3量会下降，贷款违约率会增大，不良贷款会增加，对于理性的银行而言，会进一步提高贷款利率，这样就形成一个恶性循环，导致整个银行信贷市场陷入一个风险的漩涡。4.简述不确定性的含义及不确定性条件下如何进行策略选择。（1）不确定性就是指经济行为者事先不能准确地知道自己某种决策的结果，或者说，只要经济行为主体的一种决策的可能结果不止一种、就会产生不确定性。（2）遇到此类问题时，我们可以使用最大期望收益法或者使用最大期望效用法进行决策。最大期望收益法就是在事情结果不确定的情

10、况下，应该选择给他带来“期望收益”最大的策略。5.按照行动顺序和信息结构划分博弈论的分类有哪些？各是什么含义？（1）按照行动顺序和信息结构，博弈分为完全信息动态博弈和不完全信息动态博弈。（2）在完全信息动态博弈中，如果参与者的策略在该动态博弈本身和所有子博弈中都构成一个纳什均衡，则该策略组合为一个“子博弈纳什均衡” 。（3）在不完全信息动态博弈下，如果给定参与者自己的特征和其他参与者特征概率分布的情况下，每个参与者选择的策略能使自己的期望支付达到最大化，也就是说，没有人有积极性选择其他策略，这就形成了“精炼贝叶斯纳什均衡” 。6.简述重复博弈及其特征。（1）重复博弈是指同一个博弈在相同的环境、

11、规则下反复多次执行的博弈问题。次数可以是有限的定数，也可以是无限的。重复博弈是一个动态博弈。（2）重复博弈的基本特征是：首先，重复博弈的每一个阶段之间不存在物质联系，即前一个阶段的博弈并不改变后一个阶段博弈的结构，被重复的基本博弈的结构不变；其次，在重复博弈的每一个阶段，所有参与者都可以观测到该博弈过去的历史；第三，博弈参与者总的支付是由各次博弈收益按贴现率的加权和构成。7.简述公地悲剧及如何调节。（1）1968 年，美国学者哈定在科学杂志上发表了一篇题为公地的悲剧的文章。英国曾经有这样一种土地制度封建主在自己的领地中划出一片尚未耕种的土地作为牧场(称为“公地”)，无偿向牧民开放。这本来是一件

12、造福于民的事，但由于是无偿放牧，每个牧民都养尽可能多的牛羊。随着牛羊数量无节制地增加，公地牧场最终因“超载”而持续退化，所有牧民野就一起破产而无法维持生计，这就是“公地的悲剧” 。（2）为了避免这样的结果，可以动用制度约束和道德约束来进行调节。所谓制度约束，就是要建立相应的权力机构，无论这种权力机构是公共的还是私人的。就是要建立明晰的产权制度，如这块牧场们可以明确化出若干小块，分别给相应的牧民自行管理，不能越界放牧，这样每个牧民就会在各自的小牧场放养最优数量的牛羊，而不会过度放养，避免公地悲剧的产生。所谓道德约束，就是要建立相应的基于社会到一的行为规范，让他们从人们的内心来调节自己的言行。当然

13、，随着社会经济的发展，需要政府规制和市场机制两者有机结合，才能更好的解决公共物品供给及相关长夜发展中的过度进入问题。8.简述博弈论发展的过程。（1）萌芽阶段：博弈论思想古已有之，我国古代的孙子兵法就不仅是一部军事著作，而且算是最早的一部博弈论专著。19 世纪 30 年代古诺对两寡头垄断竞争进行了比较系统的研究。艾奇沃德、斯坦克尔伯格等人对不完全竞争为博弈论的创立奠定了坚实的基础。4（2）产生阶段：1944 年科学家冯诺伊曼和经济学家奥斯卡摩根斯坦合著博弈论与经济行为将二人博弈推广到 n 人博弈结构并将博弈论系统的应用于经济领域，标志着博弈论作为一门独立的的学科诞生。1950 年和 1951 年

14、发表了 2 篇关于非合作博弈的重要文章，土克于 1950 年定义了“囚徒困境” 。(3)发展阶段：塞尔顿于 1965 年将动态分析引入了纳什均衡的概念，提出来“精炼纳什均衡”概念；海萨尼则把不完全信息引入博弈论的研究，提出来不完全信息博弈和贝叶斯均衡概念等。(4)繁荣阶段：以纳什、塞尔顿、海萨尼荣获 1994 年诺贝尔经济学奖为标志。克瑞普斯、威尔逊、米格罗姆和罗伯茨建立了非常有名的四人帮模型。这个时期是博弈论研究的一个高潮时期，一方面是合作博弈发展到了鼎盛时期。(5)成熟阶段：20 世纪 90 年代是博弈论于驻留经济学融合时期，也是博弈论走向成熟时期。 9.垄断者阻止市场进入的策略有哪些？（

15、1）扩大生产能力策略。现有企业为了防止出现因受生产限制而未能向顾客供应产品而采取的一种策略反映，就是进行投资扩大生产能力。（2） “保证最低价格”的策略. 保证最低价格条款是一种承诺，由于法律的限制，商店在向消费者公布了这一条款之后是不能不实行的，因此它是绝对可信的。（3）限制进入定价策略。限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入。潜在进入者看到这一低价后，推测出进入后价格也会那么低甚至更低，因而进入该市场终将无利可图。（4）掠夺性定价策略。掠夺性定价是指将价格设定为低于成本，而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后，掠夺企业能够行使市场权力时可能得到

16、补偿。这也是一种价格报复策略。（每点 2.5 分）10.博弈的构成要素有哪些？并对这些要素进行说明。博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。（1）参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)；（2）行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策；（3）策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；（4）得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；（5）均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈

17、结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。（每点 2 分）11.博弈论的不同分类有哪些？（1）按照参与人行动的先后顺序进行分类，分为静态博弈和动态博弈。静态博弈是指博弈中，参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈是指在博弈中，参与者的行动有先后顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。（3 分）（2）按照参与人对其他参与人的了解程度进行分类，分为完全信息博

18、弈和不完全信息5博弈。完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及策略组合下的支付有准确的信息。不完全信息博弈是指博弈过程中，参与人对其他参与人的特征、策略空间及策略组合下的支付的信息了解得不够准确或者不是对所有参与人的特征、策略空间及策略组合下的支付的信息都有准确的了解。（4 分）（3）按照参与人之间是否进行合作进行分类，分为合作博弈和非合作博弈。合作博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟，其结果对联盟方均有利；参与人在协议范围内进行博弈。非合作博弈就是参与者在行动选择时无法达成约束性的协议。（3 分）12.试述重复博弈的概念及特征。

19、（同 6）13.试阐述纳什均衡的意义。（1）纳什均衡是指在对手策略既定的情况下，各自对局者所选择的策略都是最好的。合作是有利的“利己策略” 。但它必须符合以下黄金律：按照你原意别人对你的方式来对待别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人” 。但前提是人所不欲勿施与我。（5 分）（2）其次，纳什均衡是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯诺依曼和摩根斯坦恩的合作博弈理论的重大发展，甚至可以说是一场革命。（5 分）五、论试题1.试阐述说明经济管理中的保证最低价格条款策略。（1）管理学中的“保证最低价格”的策略。（5

20、分）（2）该条款规定，顾客在本商店购买这种商品一个月内，如果发现其他任何商店比本店更低价格出售同样的商品，本店将退还差价，并补偿差额的 10%。对消费者来说，保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买，但这种条款无疑是企业之间竞争的一种手段。（5 分）（3）我们假定推行保证最低价格条款的商店为商店 A，它的竞争者为商店 B。当商店 A 把某产品定为 5000 元并推行保证最低价格条款的时候，商店 B 应如何定价最为有利呢？如果商店 B 高于 5000 元，显然对其竞争不利，因为除非顾客不了解情况，否则他们将到商店 A去购买该产品。如果商店的定价低于 5000 元，它能否

21、因此而争取到更多的顾客呢？不能，因为商店 A 已经有了保证最低价格的条款。这样，对商店 B 来说，它的最优的定价策略就是与商店 A 制定同样的价格。（5 分）2试述道德风险的含义、道德风险与逆向选择的区别及如何规避道德风险。（请举例说明，至少一个详细的案例，并加以具体的说明。）（1）在信息部不对称的情况下，委托人委托代理人从事某项工作，由于委托人无法直接观察代理人的行动，使得代理人可能为了其自身的利益二选择其行动而损害委托人的利益，这种行为就是代理人对委托人造成的“道德风险” 。(2)逆向选择是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降

22、的现象。与道德风险一样都是信息不对称情况下出现的。但逆向选择属事前机会主义行为，道德风险属于事后机会主义行为。（3)规避道德风险的策略之一就是进行有效的激励机制设计，就是在信息不对称的情况下设计一条博弈规则，令不同类型的博弈参与者做出不同的选择，并促使他们尽最大努力去工作。比如，大学公共选修课的老师们都会发现一个难题，就是有很多学生选这个课程，并不是因为喜欢它，而是为了混学分。由于老师公布的考试政策对学生而言是公共信息，但学生是否来上课并好好学习是不充分信息。由于信息不对称，老师无法政治了解哪些学生对6课程真正感新区，哪些学生企图混学分，老师就需要设计一套激励机制，对真正希望听课的学生几乎不构

23、成额外成本，而且使他们参加学习的机会成本得到降低，还应该满足学校考试制度的要求和操作简便。可以这样来考虑：首先，第一节课时就宣布考试制度和方案，不安排期末考试，只是在上课期间随机出 5 次课堂练习，并且选择其中的一次课堂练习成绩作为期末考试成绩。其次，老师选择哪一次课堂练习作为期末考试成绩取决于来上课的学生人数，老师只选学生人数最少的那一次课堂练习作为期末考试成绩。这就使得学生的最优策略是“最好我来上课” ，而且老师的机会成本也较小，因为批改的试卷最少。第三，所有要请假的学生必须实现通知到老师，而且在全部课时期间请假者，每次扣总分的10%。这样，凡是第一次课后甚至第一次课还没上完就去取消选修这

24、门课的学生，肯定就属于混学分的学生，而其他留下来的学生也会因为你设定的游戏规则而好好来上课。3.以斗鸡博弈为例谈谈企业在竞争中如何实现共赢。(1)两只山羊迎面而来，都要回到自己对面的家，却遭遇在一个独木桥上。此时，每只羊都有两个行动选择：一个是退回去，另一个是硬往前行进。其支付矩阵如下：这个博弈是山羊博弈，也叫斗鸡博弈，此时有四种可能，两只山羊对峙，两败俱伤，各自支付为-2；二是互相退让，各自支付为；还有两种情况就是一退一进，进的支付为 2，退的支付为 0。用划线法可以得到两个纯策略均衡：（前进，后退）和（后退，前进）。（2）在企业竞争中，斗鸡博弈的均衡为（前进，后退）和（后退，前进），实

25、际上双方也可能选择（前进，前进），从结果上看，不是很好的选择，但对双方也可能是最好的结构，因为斗争也是一种“造势” ， “造势”是为了今后的长远发展。在这样的博弈中要想取胜，就要则气势上压倒对方，至少要显示出破釜沉舟、背水一战的决心来，以迫使对方退让。所以在这样的博弈中，非理性、非理智的形象塑造往往是一种可选择的策略运用。（3）在企业竞争中引用斗鸡博弈的意义就在于博弈的双方如何在博弈中采用妥协的方式取得利益。如果博弈的双方都换位思考，它们可以就补偿进行谈判，最后造成以补偿换退让的协议，问题就解决了。博弈中经常有妥协，双方能换位思考就可以较容易地达成协议。考虑自己得到多少补偿才愿意退，并用自己

26、的想法来理解对方。只从自己立场出发考虑问题，不愿退，又不想给对方一定的补偿，僵局就难以打破。4.以囚徒的困境为例说明如何用下划线法寻找最优策略。1、警察把囚徒张三、李四分开关押，并在提审时分别告之，如果你坦白而对方不坦白，你将只判 0 年，对方判 5 年；如果你不坦白对方坦白，你将判 5 年对方判 0 年，如果两人都坦白都将判 3 年，如果都不坦白，都被判 1 年。2、当张三选择坦白时，对李四而言，选择坦白被判 3 年，选择抵赖被判 5 年，显然他宁愿选择坦白而不是抵赖，因为-3 大于-5，所以在张三选择坦白而李四选择坦白的那个支付-3 下划上一条横线，表示这个选择比较好；当张三选择抵赖时，对

27、李四而言，选择坦白无罪释放，选择抵赖被判 1 年，毫无疑问，他愿意坦白而不是抵赖，因为 0 大于-1，所以在张三选择抵赖而李四选择坦白的那个支付 0 下划上一条横线，表示这个选择比较好。-2，-22， 0前进0，21，1后退咩咩前进后退唛唛73、同样，当李四选择坦白时，张三如果坦白被判 3 年，抵赖则判 5 年，所以在他坦白的支付-3 下划上一条横线。当李四选择抵赖，经过分析后同样在张三坦白的支付 0 下划上一条横线。4、这样有四个数字下面被划上了横线，而在该博弈的左上角的那一个方框里，两个数字下面都有横线。就说明张三和李四都同时选择了坦白的策略，也就代表着他们的选择形成了一个交集，从而形成了

28、一个策略组合，对两个人而言，面对这个结果，各自都不愿意主动改变。5、下划线法如图所示：5.试阐述博弈论发展的几个阶段及各阶段代表人物和主要贡献。（1）萌芽阶段：博弈论思想古已有之，我国古代的孙子兵法就不仅是一部军事著作，而且算是最早的一部博弈论专著。19 世纪 30 年代古诺对两寡头垄断竞争进行了比较系统的研究。艾奇沃德、斯坦克尔伯格等人对不完全竞争为博弈论的创立奠定了坚实的基础。（2）产生阶段：1944 年科学家冯诺伊曼和经济学家奥斯卡摩根斯坦合著博弈论与经济行为将二人博弈推广到 n 人博弈结构并将博弈论系统的应用于经济领域，标志着博弈论作为一门独立的的学科诞生。1950 年和 1951 年

29、发表了 2 篇关于非合作博弈的重要文章，土克于 1950 年定义了“囚徒困境” 。(3)发展阶段：塞尔顿于 1965 年将动态分析引入了纳什均衡的概念，提出来“精炼纳什均衡”概念；海萨尼则把不完全信息引入博弈论的研究，提出来不完全信息博弈和贝叶斯均衡概念等。(4)繁荣阶段：以纳什、塞尔顿、海萨尼荣获 1994 年诺贝尔经济学奖为标志。克瑞普斯、威尔逊、米格罗姆和罗伯茨建立了非常有名的四人帮模型。这个时期是博弈论研究的一个高潮时期，一方面是合作博弈发展到了鼎盛时期，包括纳什和夏普里的“讨价还价”模型，“核”的概念。这一时期海还提出了“微分博弈” ，奥曼提出了“强均衡”概念， “重复博弈”也开始研

30、究。1996 年诺贝尔经济学奖获得者詹姆斯莫里斯教授和威廉姆维克瑞教授在 20 世纪 60、70 年代提示不对称信息对交易带来的影响，并提出相应对策。70 年代的重要事件还包括“进化博弈论” ， “进化稳定策略” ，此外“共同知识”也引起了广泛关注。(5)成熟阶段：20 世纪 90 年代是博弈论于驻留经济学融合时期，也是博弈论走向成熟时期。这个时期最重要的进展包括 Elon KohlbergZAI 1981 年引入“前向归纳法” ，克里普斯和威尔逊在 982 年提出“序列均衡” ，斯密 1982 年出版进化和博弈论，海萨尼和泽尔藤在 988 年提出有关非合作博弈中均衡选择的一般理论和标准。

31、1991 年佛德伯格和泰勒提出了“精练贝叶斯均衡” 。(每点 3 分)6.举例说明博弈论在经济管理领域的应用或现象。（至少一个详细的案例，并加以具体的说明。）（同论述题 1）7.试举例说明保证最低价格的策略。（同 1）-1，-1-5， 0不坦白0，-5-3，-3坦白张三不坦白坦白李四88.举例说明占优战略博弈。（至少 1 个案例，加以详细说明）所谓占优战略即是这样的一种策略，不管对手采取什么策略，这种策略都是最优的。当对局者选择的都是占优战略的时候，这种均衡就是占优战略均衡。（2 分）在囚徒困境中，每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择

32、对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒甲来说，囚徒乙有坦白和不坦白两种可能的选择，假设囚徒乙的选择是不坦白，则对囚徒甲来说，不坦白得益为-2，坦白得益为0，他应该选择坦白；（4 分）假设囚徒乙选择的是坦白，则囚徒甲不坦白得益为-9，坦白得益为-6，他还是该选择坦白。因此，在此博弈中，无论囚徒乙采取何种策略囚徒甲的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒乙的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略，其均衡就是占优战略均衡。（4 分9.试应

33、用博弈论知识阐述囚徒困境案例。1、警察把囚徒甲乙分开关押，并在提审时分别告之，如果你坦白而对方不坦白，你将只判 0 年，对方判 9 年；如果你不坦白对方坦白，你将判 9 年对方判 0 年，如果两人都坦白都将判 6 年，如果都不坦白，都被判 2 年。2、每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒甲来说，囚徒乙有坦白和不坦白两种可能的选择，假设囚徒乙的选择是不坦白，则对囚徒甲来说，不坦白得益为-2，坦白得益为 0，他应该选择坦白；3、假设囚徒乙选择的是坦白，则

34、囚徒甲不坦白得益为-9，坦白得益为-6，他还是该选择坦白。因此，在此博弈中，无论囚徒乙采取何种策略囚徒甲的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒乙的唯一的选择也是坦白。4、所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略，其均衡就是占优战略均衡，双方同获得益-6，即都被判 6 年。5、其支付矩阵如下：（每个空格 2 分）10.试从博弈论的角度分析价格竞争策略。1、两家企业生产同一种产品，面临降价与不减价的选择，其支付矩阵如下：-2，-2-9， 0不坦白0，-9-6，-6坦白嫌疑犯乙不坦白坦白嫌疑犯甲-50，-5080， -

35、100降价-100，800，0不降价企业乙降价不降价企业甲92、每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对企业甲来说，企业乙有降价和不降价两种可能的选择，假设企业乙的选择是不降价，则对企业甲来说，不降价得益为 0，降价得益为 80，企业甲应该选择降价； 3、假设企业乙选择的是降价，则企业甲不降价得益为-100，降价得益为-50，企业甲还是该选择降价。因此，在此博弈中，无论企业乙采取何种策略企业甲的选择只有一种，即降价，因为在另一方两种可能的情况下，降价给自己带

36、来的得益都是较大的。同样的道理，企业乙的唯一的选择也是降价。4、所以最可能的结局：该博弈的最终结果是两博弈方同时选择降价策略，同获得益-50，即双方利润减少 50 万。六、案例分析题主要结合纳什均衡原理和占优均衡原理分析具体案例。囚徒困境；智猪博弈；性别大战；价格战。案例分析（数字会有所改变）囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判 0 年，他将被判 8 年；如果你不坦白而他坦白，那么你判 8 年，他判 0 年；如果你们两人都坦白了，各判 5 年；如果你们两人都不坦白了，各判 1 年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择

37、，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒 A 来说，囚徒 B 有坦白和不坦白两种可能的选择，假设囚徒 B 的选择是不坦白，则对囚徒 A 来说，不坦白得益为-1，坦白得益为 0，他应该选择坦白；假设囚徒 B 选择的是坦白，则囚徒 A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒 B 采取何种策略囚徒 A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒 B的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选

38、择坦白策略。其支付矩阵如下：性格大战（情侣博弈）案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。1，18， 0不坦白0，85，5坦白嫌疑犯乙不坦白坦白嫌疑犯甲10当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优策略依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足

39、球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。那么，两人都去看时装表演是一种均衡状态，也就是说在这种状态下，双方都不想改变他们的策略。同样，两人都去看足球也是一种均衡状态。因此，在这个对局中，同时出现了两个均衡状态。价格战（或者降价不降价策略）案例：假设市场中仅有 A、B 两家企业，每家企业可采取的定价策略都是 10 元或 15 元，我们可以得出得益矩阵如下：分析：无论对企业 A 还是企业 B 来说，低价都是他们的占优战略。从表可见，企业 A的占优战略是 10 元，因为无论 B 采取什么战略，企业 A 都能获取比定价 15 元更多的利润。如果企

40、业 B 定价 10 元，企业 A 定价 10 元能够获利 80 万元，而定价 15 元只能获得 30万元；如果企业 B 定价 15 元，企业 A 定价 10 元可获利 170 万元，而定价 15 元却只能获利120 万元。同样地，企业 B 的占优战略也是定价 10 元的策略。如果企业 A 定价 10 元，企业 B 定价 10 元能够获利 100 万元，而定价 15 元只能获得50 万元；如果企业 A 定价 15 元，企业 A 定价 10 元可获利 180 万元，而定价 15 元却只能获利 150 万元。同样地，企业 A 的占优战略也是定价 10 元的策略。最后有一个最容易出现的结局就是（10，

41、10），故双方均采取低价策略。智猪博弈猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有 10 单位的猪食进槽，但每按一下按钮会耗去相当于 2 单位猪食的成本。150，12050，17015元180，30100，8010元企业B15元10元企业A1，20， 0时装0，02，1足球男时装足球女11如果大猪先到食槽，则大猪吃到 9 单位食物，小猪仅能吃到 1 单位食物；如果两猪同时到食槽，则大猪吃 7 单位，小猪吃 3 单位食物；如果小猪先到，大猪吃 6 单位而小猪吃 4 单位食物。下表给出这个博弈的支付矩阵。从矩阵中可以看出，当大猪选择行动的时候，小

42、猪如果行动，其收益是 1，而小猪等待的话，收益是 4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是 0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即“按”是小猪的劣战略，而等待是小猪的占优策略。所以，理性的小猪会剔除“按” ，而选择“等待” ；理性的大猪知道小猪会选择“等待” ，从而自己选择“按” ，所以，可以预料博弈的结果是(大猪按,小猪等待）。补充：有两家科技型中小企业“蓝天”和“白云” ，他们分别处于所属产业链条的上下游，而且实力不等。 “蓝天”处于产业上游，现有客户也较多：“白玉”处于产业下游，现

43、有客户较少。先遇到一个新的技术设想，两家企业可以单独改造也可以联合改造，博弈如下：分析：（1）这个博弈中，很容易通过下划线的方法找出两个纳什均衡：要么双方都选择技术改造，即（改造，改造）；要么双方都不进行改造，即（不改造，不改造）。（2） “蓝天”选择不改造， “白云”选不选改造就会形成一个纳什均衡。加入“蓝天”选择不改造，那么“白云”的最佳策略就是选择不改造。换句话说， “蓝天”选择了不改造，“白云”对选择不改造这个策略很满意。同样，加入“白云”选择了不改造，那么“蓝天”对选择不改造的策略也是满意的。（3）这个博弈很明显双方都比较满意（改造，改造）这个均衡，而不是（不改造，不改造），但

44、（不改造，不改造）也是纳什均衡，因为当双方选择（不改造，不改造）这个策略组合时，每个参与者的选择都是对对手做出回应的最佳策略。当然（改造，改造）是最好的纳什均衡，因为选择这个策略组合时，双方都能得到最大的报酬，都会对自己的策略选择感到满意，而不会后悔。（4）除此外的（改造，不改造）或者（不改造，改造）都不是纳什均衡，因为这个选择会让大家后悔。加入“蓝天”选择了不改造而”白云“选择了改造，那么“白云”看到这个结果会后悔自己的选择，因为选择不改造，可以得到更高的收益。此时， “蓝天”看10，63， 0改造2，14，2不改造蓝天改造不改造白云0， 09，-1等待4，45，1按大猪等待按小猪12到“白

45、云”的选择，也会感到后悔，后悔自己选择不改造。再假设“蓝天”和“白云”两家公司目前所处的环境必须要求他们都进行技术改造，如果“白云”不改造，就会因为不符合国家标准二 2 不得不关门停业，如果只有“蓝天”进行技术改造，虽然上游产品得到改善，但下游产品没有跟着改善，也意味着“蓝天”的技术改造不会通过“白云”的产品体现出来，不会为其带来与此对应的或者额外的福利。博弈如下：分析（1）这个博弈也有两个纳什均衡：要么双方都选择技术改造，即（改造，改造）；要么双方都不进行改造，即（不改造，不改造）。但是双方付出的支付却大相径庭。（2）尽管（改造，改造）是一个很明显的纳什均衡，但也不影响（不改造，不改造）

46、成为一个纳什均衡。如果“蓝天”选择了不改造，那么“白云”选择不改造不会后悔，因为无论他选择什么，都不能获得收益，同样，加入“白云”选择了不改造，那么“蓝天”选择不改造也不会后悔，因为她也没有更好的选择。这个博弈说明：在对手出招的时候，如果你除此以外没有更好的选择，你就不会后悔做出这样的策略选择。（3）这个博弈中，如果双方或者某一方不进行技术改造的话，两家企业都只有死路一条，所以（改造，改造）是优先级的纳什均衡策略，而（不改造，不改造）是次级的纳什均衡策略。这两家企业要想办法从次级的纳什均衡策略（不改造，不改造）转到优先级的纳什均衡策略（改造，改造）上来。只要两家企业没有过节，坐下来谈一谈就可以达成合作的协议，及时有过节也应该要考虑企业的发展大计而选择合作。10，60， 0改造0，00，0不改造蓝天改造不改造白云

展开阅读全文