收藏 分享(赏)

经济博弈论第三版.doc

上传人:wspkg9802 文档编号:9258472 上传时间:2019-07-31 格式:DOC 页数:26 大小:553.04KB
下载 相关 举报
经济博弈论第三版.doc_第1页
第1页 / 共26页
经济博弈论第三版.doc_第2页
第2页 / 共26页
经济博弈论第三版.doc_第3页
第3页 / 共26页
经济博弈论第三版.doc_第4页
第4页 / 共26页
经济博弈论第三版.doc_第5页
第5页 / 共26页
点击查看更多>>
资源描述

1、 经济博弈论第三版习题博 弈 论判断题(每小题 1 分,共 15 分)囚徒困境说明个人的理性选择不一定是集体的理性选择。 ( )子博弈精炼纳什均衡不是一个纳什均衡。 ( )若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。 ( )博弈中知道越多的一方越有利。 ( ) 纳什均衡一定是上策均衡。 ( )上策均衡一定是纳什均衡。 ()在一个博弈中只可能存在一个纳什均衡。 ()在一个博弈中博弈方可以有很多个。 ()在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 ( )在博弈中纳什均衡是博弈双方能获得的最好结果。 ( )在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。 (

2、)上策均衡是帕累托最优的均衡。 ()因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。()在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。()在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。()纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。( )不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,

3、共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。( )多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。( )如果阶段博弈G=A1, A2,An; u1, u2,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t10,000,则该笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么?答十、纳什均衡有无数

4、个。最可能的结果是(5000,5000)这个聚点均衡。9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000 元的垄断利润,但不受限制的竞争会使每一方的利润降至 60000 元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利 900000 元。(1)将这一市场用囚徒困境的博弈加以表示。(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。答:(1)用囚徒困境的博弈表示如下表:北方航空公司合作 竞争合作 500000,500000 0,900000新华航空公司竞争 900000,0 60000,6000

5、0(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(600000) ;若新华航空公司选择合作,北方航空公司仍会选择竞争(900000500000) 。若北方航空公司选择竞争,新华航空公司也将选择竞争(600000) ;若北方航空公司选择合作,新华航空公司仍会选择竞争(9000000) 。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为 600000 元。12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1) (低价,高价) , (

6、高价,低价)(2) (低价,高价)13、A、B 两企业利用广告进行竞争。若 A、B 两企业都做广告,在未来销售中,A 企业可以获得 20 万元利润,B 企业可获得 8 万元利润;若 A 企业做广告,B 企业不做广告,A 企业可获得 25 万元利润,B 企业可获得 2 万元利润;若 A 企业不做广告,B 企业做广告,A 企业可获得 10 万元利润,B 企业可获得 12 万元利润;若 A、B 两企业都不做广告,A 企业可获得 30 万元利润,B 企业可获得 6 万元利润。(1)画出 A、B 两企业的支付矩阵。(2)求纳什均衡。3. 答:(1)由题目中所提供的信息,可画出 A、B 两企业的支付矩阵(

7、如下表) 。B 企业做广告 不做广告做广告 20,8 25,2A 企业不做广告 10,12 30,6(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。如果 A 厂商做广告,则 B 厂商的最优选择是做广告,因为做广告所获得的利润 8 大于不做广告获得的利润 2,故在 8 下面划一横线。如果 A 厂商不做广告,则 B 厂商的最优选择也是做广告,因为做广告获得的利润为 12,而不做广告的利润为 6,故在 12 下面划一横线。如果 B 厂商做广告,则 A 厂商的最优选择是做广告,因为做广告获得的利润 20 大于不做广告所获得的利润 10,故在 20 下面划一横线。如果 B

8、 厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润 30 大于做广告所获得的利润 25,故在 30 下面划一横线。在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是 A、B 两厂商都做广告。15、求出下面博弈的纳什均衡(含纯策略和混合策略)。乙L RU 5,0 0,8甲D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略 Nash 均衡。可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略 Nash 均衡( ),( )981,734,16、 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由

9、如下得益矩阵给出:(1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡?参考答案:由划线法可知,该矩阵博弈有两个纯策略 Nash 均衡,即(低质量, 高质量), (高质量,低质量)。乙企业高质量 低质量高质量 50,50 100,800甲企业 低质量 900,600 -20,-30该矩阵博弈还有一个混合的纳什均衡Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得 1386y,972x因此该问题的混合纳什均衡为 。)1385,6()97,12(17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳

10、什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?乙企业开发 不开发开发 -10,-10 100,0甲企业 不开发 0,100 0,0解:用划线法找出问题的纯策略纳什均衡点。0,1,所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。该博弈还有一个混合的纳什均衡( ),( )。,0,如果乙企业所在国政府对企业开发新产品补贴 a 个单位,则收益矩阵变为: ,要使0a1,0(不开发,开发)成为该博弈的唯一纳什均衡点,只需 a10。此时乙企业的收益为 100+a。18、博弈的收益矩阵如下表:乙左 右上 a,b c,d甲下 e,f g,h(1)如果(上,左)是占优策

11、略均衡,则 a、b、c、d、e、f、g、h 之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?(3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么?(4)在什么情况下,纯战略纳什均衡不存在?答:(1) , , , 。本题另外一个思考角度是从占优策略均衡的定义出发。eagcdbhf对乙而言,占优策略为 ;而对甲而言,占优策略为 。综合起来可得到所需结),(,hdfb ),(,geca论。(2)纳什均衡只需满足:甲选上的策略时, ,同时乙选左的策略时, 。故本题中纳什均dba衡的条件为: , 。dea(3)占优策

12、略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。(4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。19、Smith 和 John 玩数字匹配游戏,每个人选择 1、2、3,如果数字相同, John 给 Smith 3 美元,如果不同,Smith 给 John 1 美元。(1)列出收益矩阵。(2)如果参与者以 1/3 的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。John1 2 31 3,-3 -1,1 -1,12 -1,1 3,-3 -1,1Smith3 -1,1

13、-1,1 3,-3(2)Smith 选(1/3,1/3,1/3)的混合概率时,John 选 1 的效用为: 313)(1UJohn 选 2 的效用为: 2John 选 3 的效用为: 31)(133 类似地,John 选(1/3,1/3,1/3)的混合概率时,Smith 选 1 的效用为: )()(1USmith 选 2 的效用为: 313132 Smith 选 3 的效用为: )()(因为 , ,所以:321U321是纳什均衡,策略值分别为 John: ;Smith: 。),(),3( 31U3120、假设双头垄断企业的成本函数分别为: , ,市场需求曲线为 ,其120QC2 QP240中,

14、 。21Q(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润,并以图形表示。(3)说明导致上述两种均衡结果差异的原因。答:(1)对于垄断企业 1 来说:219020)(4max 1Q这是垄断企业 1 的反应函数。其等利润曲线为: 121380对垄断企业 2 来说: 4502)(max12Q这是垄断企业 2 的反应函数。其等利润曲线为: 21240在达到均衡时,有: 308245092111 QQ均衡时的价格为: 8)3(240P两垄断企业的利润分别为: 180821

15、36042 均衡点可图示为:0企业 195 200190企业2企业 1 的反应线均衡点(2)当垄断企业 1 为领导者时,企业 2 视企业 1 的产量为既定,其反应函数为: 4/50Q则企业 1 的问题可简化为: 3/802204max1 111Q均衡时价格为: 640P利润为: ,3/9219/25该均衡可用下图表示:Stackelberg 均衡点 企业 2 的反应线500企业 195 200190企业2企业 1 的反应线企业 2 领先时可依此类推。(3)当企业 1 为领先者时,其获得的利润要比古诺竞争下多。而企业 2 获得的利润较少。这是因为,企业 1 先行动时,其能考虑企业 2 的反应,并

16、以此来制定自己的生产计划,而企业 2 只能被动地接受企业 1 的既定产量,计划自己的产出,这是一种“先动优势”21、在一个由三寡头操纵的垄断市场中,逆需求函数为 p=a-q1-q2-q3,这里 qi是企业 i 的产量。每一企业生产的单位成本为常数 c。三企业决定各自产量的顺序如下:(1)企业 1 首先选择 q10;(2)企业 2 和企业 3 观察到 q1,然后同时分别选择 q2和 q3。试解出该博弈的子博弈完美纳什均衡。答:该博弈分为两个阶段,第一阶段企业 1 选择产量 q1,第二阶段企业 2 和 3 观测到 q1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。(1)假设

17、企业 1 已选定产量 q1,先进行第二阶段的计算。设企业 2,3 的利润函数分别为:212c)a(3qq由于两企业均要追求利润最大,故对以上两式分别求一阶条件:(1)03212 cq(2)qa3213求解(1) 、 (2)组成的方程组有:(3)3cq1*2(2)现进行第一阶段的博弈分析:对与企业 1,其利润函数为;1321cq)qa(将(3)代入可得:(4)3)cqa(11式(4)对 q1求导: 0c2aq11解得:(5))ca(21q*此时, 2*1)ca((3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:,)ca(21q*)ca(61q*3225、某寡头垄断市场上有两个厂商,

18、总成本均为自身产量的 20 倍, 市场需求函数为 Q=200-P。求(1)若两个厂商同时决定产量,产量分别是多少?(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60(2)200-2Q=20,Q=90,Q1=Q2=4526、一个工人给一个老板干活,工资标准是 100 元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉 60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80 元产出,但老板在支付工

19、资之前无法知道实际产出,这些情况双方都知道。请问:(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。(1)完全信息动态博弈。博弈结果应该是工人偷懒,老板克扣。(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。27、举一个你在现实生活中遇到的囚犯两难困境的例子。答:在校园的人行道交叉路口,无需红绿灯。现在两人分别骑车从东西方向和南北方向通过路口。若同时往前冲,必定相撞,各自支付为(-2,-2) ;若同时停下,都不能按时前进,支付为(0,0) ;若一

20、人前进一人停下,支付为(2,0)或(0,2) 。相应的策略和支付矩阵如下表。乙前进 停下前进 -2,-2 2,0甲停下 0,2 0,028、给定两家酿酒企业 A、B 的收益矩阵如下表:A 企业白酒 啤酒白酒 700,600 900,1000B 企业啤酒 800,900 600,800表中每组数字前面一个表示 B 企业的收益,后一个数字表示 B 企业的收益。(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少?(3)如何改变上述 A、B 企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述 A、B企业的收益才能使

21、该博弈不存在均衡?答:(1)有两个纳什均衡,即(啤酒,白酒) 、 (白酒,啤酒) ,都是纳什均衡而不是占优策略均衡。(2)显然, (白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒) ,则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900 变为 900+1000,增量为 200。(3)如将(啤酒,白酒)支付改为(1000,1100) ,则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500) ,将(白酒,啤酒)支付改为(900,500) ,则该博弈就不存在任何占优策略均衡或纳什均衡。30、在

22、纳税检查的博弈中,假设 A 为应纳税款,C 为检查成本,F 是偷税罚款,且 C1/4 时,才存在子博弈完美纳什415)s(Pci*i 均衡。37、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P是市场价格,Q是n个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子是多少。并请解释与n的关系。 分析:此题可分解为3个步骤 (1)n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。 (2)其中一个企业采取欺骗手段降价,那

23、个这家企业就占有的全部市场,获得垄断利润 (3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。 参考答案:(1)设每个企业的边际成本为c,固定成本为0 P=a-Q TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2 =(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n (2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 ,获得所有的垄断利润(a-c)2/4 (3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑: A企业不降价: (a-c)2/4n, (a-c)2

24、/4n, A企业降价: (a-c)2/4, 0, 使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。 设贴现因子为 A不降价的贴现值: (a-c)2/4n1/(1- ) A降价的现值: (a-c)2/4 于是:(a-c)2/4n1/(1- ) (a-c)2/4 解得: 1-1/n 38、假设某劳动市场为完全竞争市场,其供求函数如下: S L:W=120+2L DL:W=360-L 已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10L 0.5K0.5 (K=100) 且其产品的需求与供给函数分别为 D:P=60-2q S: P=20+2q 试求 (a)该厂商

25、的AC L,MCL及VMP L各为多少? (b)劳动工资为多少?厂商会雇用多少劳动? 由:S L=DL解得:W=280 由于产品市场为完全竞争市场,且要素市场也为完全竞争市场 所以,满足:产品市场均衡:P=MR=MC=W/MP L要素市场均衡:W= AC L=MCL=VMPL 得到:AC L=MCL=VMPL=280 由:D=S解得:P= 40,q=10 厂商追求利润最大化的情况下: W*=VMPL=P*MPL=P*50/L0.5L*=100/2*PW*2=51 (取整数)论述题(每小题 20 分,共 20 分)解释“囚犯困境”,并举商业案例说明。囚徒困境是博弈论里最著名的例子之一,几乎所有的

26、博弈论著作中都要讨论这个例子。这个例子是这样的:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱 5 年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚徒可以期望被从轻发落入狱 2 年;另一方面,如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱 1 年,而不坦白的囚徒将被判入狱 10 年。表 6-2 给出了囚徒困境的策略式表述。这里,每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。(注意,这里的得益是负值。)表 6-2 囚徒困境囚徒乙坦白 不坦白坦白 -5, -5 -1, -1

27、0囚徒甲不坦白 -10, -1 -2, -2在囚徒困境这个模型中,纳什均衡就是双方都坦白,给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策(dominant strategy)均衡,即不论对方如何选择,个人的最优选择是坦白。因为如果乙不坦白,甲坦白的话就被轻判 1 年,不坦白的话就判 2 年,坦白比不坦白要好;如果乙坦白,甲坦白的话判 5 年,不坦白的话判 10 年,所以,坦白仍然比不坦白要好。这样,坦白就是甲的上策,当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。寡头垄断厂商经常发现它们自己处于一种囚

28、徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。解释“智猪博弈(boxed pigs)”,并举商业案例说明。智猪博弈的例子讲的是:猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按扭,控制着猪食的供应。每按一下按扭会有 10 个单位的猪食进槽,但谁按按扭谁就要付 2 个单位的成本并且晚到猪食槽。若大猪先到猪食槽,大猪吃到 9 个单位,小猪只能吃到 1 个单

29、位;若小猪先到猪食槽,大猪吃到 6 个单位,小猪吃 4 个单位;若同时到,大猪吃到 7 个单位,小猪只能吃 3 个单位。表 6-3列出了对应于不同策略组合的得益水平。例如,表中第一格表示大猪小猪同时按按扭,从而同时走到猪食槽,大猪吃 7 个,小猪吃 3 个,除去 2 个单位成本,得益分别为 5 和 1。表 6-3 智猪博弈小猪按 不按按 5, 1 4, 4大猪不按 9, -1 0, 0从表 6-3 可以看到,对于小猪来说,如果大猪按,它则不按更好;如果大猪不按,它不按也更好,所以,不论大猪按还是不按,它的最优策略都是不按。给定小猪不按,大猪的最优选择只能是按。所以,纳什均衡就是大猪按,小猪不按

30、,各得 4 个单位猪食。市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研究与开发,为新产品做广告,而对小企业来说这些工作可能得不偿失。所以,小企业可能把精力花在模仿上,或等待大企业用广告打开市场后再出售廉价产品。解释“夫妻博弈”(battle of the sexes)”,并举商业案例说明。“夫妻博弈”(battle of the sexes)的例子讲的是一对谈恋爱的男女安排业余活动,他们有二种选择,或去看足球比赛,或去看芭蕾舞演出。男方偏好足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。表 6-6 给出了这个博弈的得益矩阵。在这个博弈中,如果双方同时决定,则有两个纳什均衡,即都去看

31、足球比赛和都去看芭蕾演出。但是到底最后他们去看足球比赛还是去看芭蕾演出,并不能从中获得结论。如果假设这是个序列博弈,例如,当女方先作出选择看芭蕾演出时,男方只能选择芭蕾;当女方先选择了看足球比赛时,男方也只能选择足球。反之,当男方先选择了看足球比赛时,女方只能选择看足球比赛;当男方先选择了看芭蕾演出时,女方只能选择芭蕾。表 6-6 夫妻博弈女足球 芭蕾足球 2,1 0,0男芭蕾 0,0 1,2在这个博弈例子中,先行动者具有明显的优势,女方通过选择芭蕾造成一种既成事实,使得男方除了一起去看芭蕾之外别无选择。这就是我们在斯塔克尔伯格模型中提到的先动优势(first mover advantage)

32、。在那个模型中,先行动的厂商选择一个很高的产量水平,从而使它的竞争对手除了选择小的产量水平之外没有多大的选择余地。解释古诺模型。解释斯塔克尔伯格模型。 斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行。比如在美国汽车产业发展史中的某些阶段,通用汽车就扮演过这种领导者的角色(这一例子把模型直接扩展到允许不止一个追随企业,如福特、克莱斯勒等等)。根据斯塔克尔贝里的假定,模型中的企业选择其产量,这一点和古诺模型是一致的(只不过古诺模型中企业是同时行动的,不同于这里的序贯行动)。博弈的时间顺序如下:(1)企业 1 选择产量 q1 0; (

33、2)企业 2 观测到然后选择产量 q2 0(3)企业 1 的收益由下面的利润函数给出: 这里 P(Q)=a-Q,是市场上的总产品 Q=q1+q2 时的市场出清价格,c 是生产的边际成本,为一常数(固定成本为 0)。 为解出这一博弈的逆向归纳解,我们首先计算企业 2 对企业 1 任意产量的最优反应,R2(q1)应满足: 对上面的通过求极值可得: 已知 q12-3p 即 p0.4 的时候,警察最好选择巡逻;反之 2p0 即 q0.33 时,他的理性选择是作案,反之不作案。在这个博弈中,警察以 0.33 的概率巡逻 0.67 的概率休息,犯罪者以 0.4 的概率作案 0.6 的概率不作案构成一个混合

34、纳什均衡。上述混合纳什均衡可以这样理解,如果警察以高于 0.33 的概率巡逻,犯罪者最好是躲避起来。犯罪者一旦躲避,警察就没有收获,于是降低巡逻的概率,于是犯罪者重新活跃,于是警察又提高巡逻概率从一个长期来看,两者的均衡将维持在警察以 0.33 的概率巡逻犯罪者以 0.4 的概率作案上面。现实中,我们看到,当严打的时候(警察出击的概率较高),犯罪分子便收敛一阵(降低作案概率);严打的时期一过,犯罪分子又开始兴风作浪,在不能容忍罪犯过分猖狂的时候,警界不得不再次开始严打。在上述例子中,可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好理解,那么可以尝试这样理解他们:作案的犯罪者越多,那么

35、出动的警察将会越多,作案的犯罪者越少,出动的警察将越少;反过来,出动的警察越多,作案的犯罪者就越少,出动的警察越少,作案的犯罪者就越多。极端地假设一个例子(它有助于我们的理解),警局有 100 名警察,犯罪集团有 100 名犯罪者,那么上例博弈中,警察以 0.33 的概率巡逻而犯罪者以 0.4 的概率作案这一纳什均衡可以理解为:在巡逻的警察少于 33 人时,犯罪集团最好派 40 名以上的犯罪者作案;在巡逻警察多于 33 人时,犯罪集团最好派 40 名以下的犯罪者作案;反过来,犯罪集团派 40 名以下犯罪者作案,警局最优选择出动 33 名以下的警察;犯罪集团派40 名以上犯罪者作案,警局最优选择出动 33 名以上的警察。当然,如果犯罪集团倾巢出动,那么警察的选择也是全部出动,但警察一旦全部出动,犯罪者最好选择全部不作案,犯罪者一旦选择全部不作案,警察最好全部选择休息最后长期的均衡状态是,警局派 33 名警察巡逻,犯罪集团派 40 个人作案。这可以解释现实中,为什么警界总安排有巡逻力量,而犯罪者也总保持一定的作案数量。总之,这种警察和犯罪者的博弈所揭示出:加重对罪犯的处罚在长期中并不能抑制犯罪(而只能使警察偷懒);加重处罚失职警察恰恰是会降低犯罪发生的概率。这种警察和犯罪者的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报