1、22双矩阵博弈的图解法,双矩阵的含义以Battle of Sexes为例,介绍22双矩阵博弈模型的图解法为便于说明,将Battle of Sexes模型再次复制与此,图解法:古诺模型,这里考虑连续形式的古诺模型两个企业,分别表示为企业1、企业2每个企业的策略是选择产量(用qi表示),支付是利润(用i表示),它是两个企业产量的函数,生产成本与产量有关,用Ci(qi)表示,市场出清价格为P=P(q1+q2)第i个企业的利润函数为:i=qi P(q1+q2) Ci (qi), i=1, 2,(q1*, q2*)是均衡产量意味着:q1*argmax1(q1, q2*)q2*argmax2(q1*, q
2、2)根据上面两个式子可以得出反应函数(reaction function):q1*=R1(q2)q2*=R2(q1)两个反应函数的交叉点就是纳什均衡(q1*, q2*),见图1-9,图解法:古诺模型,q2,q1,图1-9 古诺模型的纳什均衡,NE,图解法:古诺模型,R2,R1,一对夫妻要决定去看时装表演还是看足球赛。有关纯策略及相应支付情况如图1-16所示设妻子的混合策略为(r,1-r),丈夫的策略为(q,1-q)。这里的r,q分别表示妻子或丈夫观看时装表演的概率为便于分析,将混合策略列于右上角,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,若丈夫以q的概率选择
3、去看时装表演(以1-q的概率去看足球),则妻子选择时装和观看足球的期望收益分别为,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,比较1与2可知当q1/3时,则选择看时装表演,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,上述情况反映了妻子针对丈夫不同策略下的最佳反应,称为(妻子的)反应函数.,r,q,0 1/3 1图1-17 妻子的反应函数,1,r=R1(q),可用图1-17表示妻子的反应函数,22双矩阵博弈的图解法,同理,可绘出丈夫的反应函数,见图1-18,r,q,0 1/3 1图1-18 丈夫的反应函数,1,q=R2(r),3
4、/4,22双矩阵博弈的图解法,r,q,0 1/3 1图1-17 妻子的反应函数,1,r,q,0 1/3 1图1-18 丈夫的反应函数,1,r=R1(q),q=R2(r),3/4,22双矩阵博弈的图解法,将这两张图合并,得到图1-19,r,q,0 1/3 1图1-19 性别战的图解法,1,q,r=R1(q),q=R2(r),3/4,按照纳什均衡的定义,图上的三个交点既是参与人1的最优反应函数上的点,同时也是参与人2最优反应函数上的点,22双矩阵博弈的图解法,r,q,0 1/3 1图1-19 性别战的图解法,1,q,r=R1(q),q=R2(r),3/4,这三个点的坐标为(0, 0), (1/3,
5、 3/4),(1, 1)。对应的三个策略分别是:(足球,足球);妻子、丈夫分别以1/3、3/4的概率选择时装;(时装,时装)。,22双矩阵博弈的图解法,求解重复剔除劣战略均衡练习1,求解重复剔除劣战略均衡练习2,纳什均衡求解:画线法(练习),纳什均衡求解:图解法(练习),纳什于1950年提出并证明了纳什定理纳什定理的主要内容为:在一个有n个参与人的策略式博弈G=S1,Sn; u1,un中,如果n是有限的,且Si是有限集(i=1,n),则该博弈至少存在一个纳什均衡(在混合策略意义下),纳什定理,纳什定理的一些说明,纳什定理的证明要用到不动点定理。所谓不动点定理,是指一个定义在X X上的函数f(x
6、),集合X是非空的、闭的、有界的和凸的函数f是连续的则至少存在一个x,使得f(x)=x, x 被称为不动点,纳什定理的一些说明,运用不动点定理证明纳什定理的主要步骤是设计一个策略组合空间上的一个映射,说明该映射的任何不动点都是一个纳什均衡使用不动点定理证明这个映射一定存在一个不动点,纳什定理的一些说明,映射选择的是n人最优反应对应其含义是,对于任意一个混合策略组合(p1,pn),对于每一个参与人i,求出I针对其他参与人混合策略(p1,pi-1, pi+1,pn)的最优反应,然后构建n个参与人最优反应对应的卡氏积。一个最优混合策略组合就是这一对应集的不动点。,纳什定理的一些说明,因此只要证明前面
7、的最优反应对应满足不动点定理条件就可以了。,多重纳什均衡解及其分析,纳什定理说明了纳什均衡在相当广泛的博弈模型中普遍存在但是纳什均衡只是理论模型的导出结果,其适用性存在一定局限纳什均衡的理论基础:如经济理性、决策准则一致性、共同知识等并不能涵盖现实行为(互惠性、利他性、不理性等),多重纳什均衡解及其分析,帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中,若存在一个纳什均衡,其支付结果针对每个参与人而言都严格优于其它纳什均衡,则该纳什均衡是帕雷托占优纳什均衡。,一个战争与和平的博弈简例,见图1-20。该博弈有两个纯策略均衡(战争,战争),(和平,和平)。(和平,和平)在帕雷托占优意义上是较
8、好的一个均衡策略。,图1-20 帕雷托占优均衡,多重纳什均衡解及其分析,风险占优均衡(risk-dominant equilibrium)以图1-21为例该博弈有两个纯策略均衡(U,L)和(D,R)。显然,在帕雷托占优意义下,(U,L)要优于( D,R)。,图1-21 风险占优均衡,多重纳什均衡解及其分析,但进一步分析不难发现,若参与人选择策略U,万一参与人2选择策略R,参与人2损失只有1单位,但对于参与人1来说只能得到支付0。也就是说,策略U对于参与人1来说是风险较大的策略。,图1-21 风险占优均衡,多重纳什均衡解及其分析,而另一个纯策略组合(D,R)则是风险占优的许多博弈实验研究表明,实
9、际中,人们更愿意选择风险占优均衡,图1-21 风险占优均衡,多重纳什均衡解及其分析,多重纳什均衡解及其分析,一个经典博弈问题:Stag Hunt两个人同时发现1头鹿和2只兔子,如果两人合力抓鹿,则可以把这头价值10单位的鹿抓住,兔子则跑掉;如果两个人都去抓兔子,则各可以抓到1只价值3单位的兔子,鹿就会跑掉;但如果一个人选择了抓兔子而另一个人选择了抓鹿,那么选择抓兔子的能抓到1只兔子,选择抓鹿的人则一无所获。由于两人来不及商量,决策必须瞬间作出,上述问题可表示为双矩阵形式,见图1-22该博弈也存在两个纯策略纳什均衡,分别为(鹿,鹿)、(兔子,兔子)其中风险占优的均衡为(兔子,兔子),均衡收益分别
10、为(3, 3),图1-22 猎鹿博弈,多重纳什均衡解及其分析,多重纳什均衡解及其分析,风险占优均衡的进一步说明。参与人对风险占优均衡的选择倾向,有一种强化的机制。当部分或所有参与人选择风险占优均衡的可能性增强的时候,任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小,而这又使得帕雷托占优均衡策略的支付更小,从而形成一种选择风险占优均衡策略的正反馈机制,并使其出现的概率越来越大。,多重纳什均衡解及其分析,当参与人数目增加时,选择合作的风险将会更大,可借助该点考虑招标机制如何减少投标方勾结问题上述问题是我们知道建立诚信机制社会的重要意义上述问题引出一个博弈相关分支为协调博弈(coordinat
11、ion game),多重纳什均衡解及其分析,聚点均衡由实际问题抽象出来的博弈模型中,更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系,如夫妻爱好问题的两个纯策略均衡。这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例,在实际中往往二人很默契地知道如何进行博弈,双方往往知道怎么进行选择策略,且能够相互了解(这里面排除了互相协商后达成的一致),实际博弈中参与人往往会利用博弈模型以外的信息,实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范,共同的知识,具有特定意义事物的特征,某些特殊的数量、位置关系等,多重纳什均衡解及其分析,一些
12、 可能的“聚点”,如中午与12:00的聚点;夫妻爱好博弈中“(服装,服装)”与“今天是妻子生日”的聚点;参与人中地位不一致造成的均衡向有地位方倾斜的“聚点”,等等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,但因为涉及因素太多,对于一般博弈模型很难总结普遍规律,只能具体问题具体分析,多重纳什均衡解及其分析,多重纳什均衡解及其分析,相关均衡(correlated equilibrium)实际上,在现实中遇到选择困难时,特别是在长期中反复遇到相似选择难题时,常会通过收集更多信息,形成特定的机制和规则,为某种形式的制度安排等主动寻找思路。相关均衡就是这样的一种均衡选择机制。,多重纳什均衡解
13、及其分析,图1-23的一个博弈该博弈有两个纯策略均衡,为(U,L)和(D,R),以及一个混合策略均衡(1/2,1/2),(1/2,1/2)两个纯策略均衡能使双方得到6单位支付,但支付水平相差较大,图1-23 相关均衡,多重纳什均衡解及其分析,若采用混合策略均衡(1/2,1/2),(1/2,1/2),则有1/4概率遇到最不希望的结局(U,R),同时双方期望支付为2.5,也不理想,图1-23 相关均衡,多重纳什均衡解及其分析,若建立这样的机制:抛一枚硬币,若正面朝上参与人1采用U,参与人2采用L;出现反面参与人1采用D,参与人2采用R的规则,这样的规则排除了最不利的(U,R)组合期望收益都等于3,
14、处于相对公平状态,图1-23 相关均衡,多重纳什均衡解及其分析,进一步发展上述思路,还可以建立一个更好的博弈机制,这就是相关均衡理论(参阅文献4:193241)对于实际中比较复杂的博弈问题,参与人是否有能力设计这种机制,并且有足够能力理解、信任这种机制,是有一定疑问的。相关均衡作为社会经济制度创新的一种解释也许更有意义。,多重纳什均衡解及其分析,防共谋均衡(coalition-proof equilibrium)在有多个参与人的博弈中,若部分参与人通过某种形式的默契或串通形成小团体,可能得到比不串通个大的支付。这就是多人博弈的共谋问题。防共谋均衡是指这样的一个纳什均衡,在该均衡局势下,少数参与
15、人集合不能通过均衡策略的偏离,实现更好的局部利益。,多重纳什均衡解及其分析,在图1-24所示的博弈中,参与人1选择行策略U,D,参与人2选择列策略L,R,参与人3选择矩阵A,B。通过划线法,不难发现,该博弈有两个纯策略纳什均衡(U,L,A)和(D,R,B)。且前者无论是帕雷托意义下还是风险占优意义下,均优于后者。,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,因此,若不考虑部分参与人存在串通的可能性,那么该博弈的结果应该是(U,L,A)。但是,若考虑参与人之间存在串通的可能,那么(U,L,A)很难成为博弈的最终结果。因为,图1-24 多人博弈中的共谋问题,参
16、与人3A,参与人3B,多重纳什均衡解及其分析,若参与人3选择A,只要参与人1和2达成一致行动的默契,分别采用D和R,他们就可以获得1单位的支付,大于(U,L,A)时得到的0支付。一旦参与人3认为参与人1和2存在勾结,则参与人3将选择策略B。而参与人1、2一旦认识到参与人3可能选择B,则他们会选择策略组合(D,R)。,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,因此,从防共谋角度考虑,策略(D, R, B)还是重要的可取方案之一,是一个防共谋均衡,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,防共谋均衡是两个以上参与人参加的博弈中,参与人在帕雷托占优均衡中进行合作思想的扩展。,多重纳什均衡解及其分析,定义:如果一个博弈的某个策略组合满足没有任何单个参与人的“串通”会改变博弈的结果,即单独改变策略无利可图(该策略组合是纳什均衡)。给定选择偏离的参与人有再次偏离的自由时,没有任何两个参与人通过“串通”改变博弈的结果。依此类推,直到所有参与人都参加的串通也不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”,