1、第五篇 不确定性决策第十六章 对策论本章的学习要求与内容本章要求掌握对策论的性质、要素和类型,求解完全信息和不完全信息对策均衡的方法。本章分三节,分别介绍对策的特点、完全信息对策、不完全信息对策。,第五篇-第十六章 对策论,2/30,2018/4/15,第一节 对策特点,一、对策的性质1. 对策论是研究理性决策主体间发生冲突时的决策及其均衡问题,即研究理性决策者之间冲突和合作的理论。2. 对策论中个人决策同任何经济主体一样,是在给定约束条件下追求效用或收益最大化,但其约束条件不尽相同。传统经济学中经济主体独自决策,既不考虑自己的决策对他人决策的影响,也不考虑他人决策对自己决策的作用,而对策论里
2、的对策,不仅依赖于自己的选择,也依赖于他人的选择,个人最优选择是其他人选择的函数,这就考虑了人们决策的相互影响,更接近于现实世界。,第五篇-第十六章 对策论,3/30,2018/4/15,3. 对策论的应用领域很多,包括政治、经济、军事、体育以及国际关系等多个方面。在经济学中,这种重视理性选择的相互依赖性的思想,不仅构成了现代微观经济学的重要理论,而且为宏观经济分析提供了重要的微观基础 。,第一节 对策特点,第五篇-第十六章 对策论,4/30,2018/4/15,二、对策要素(一) 局中人1. 局中人是指参与对策的直接当事人,他是对策的决策主体和策略的制定者。在不同的对策问题中,局中人的含义是
3、不同的,可能是个人,也可能是团体或集团。2. 对策论要求局中人具有理性。(二) 策略集合1. 策略集合是局中人可能采取的全部策略的集合。2. 每个策略集合至少应该有两种不同的策略。,第一节 对策特点,第五篇-第十六章 对策论,5/30,2018/4/15,(三) 收益函数1. 收益函数表征了局中人从对策中获得的收益或效用水平,它是所有局人中策略的函数。2. 收益函数通常可以用两种形式表示:一种是用实物或货币收入的绝对数值或相对数值,另一种是用局中人的效用。(四) 信息1. 对策的信息是指局中人有关对策的全部知识,包括局中人的特征和行动。2. 信息集是局中人在对策进行到某一点时,对于不同变量取值
4、的全部知识之和。,第一节 对策特点,第五篇-第十六章 对策论,6/30,2018/4/15,(五) 结果结果指的是局中人在对策完成之后,感兴趣的所有要素的集合,如均衡策略组合、均衡收益组合等。(六) 均衡均衡是所有局中人最优策略的组合。,第一节 对策特点,第五篇-第十六章 对策论,7/30,2018/4/15,三、对策的类型(一) 合作对策与非合作对策1. 按照局中人之间能否达成一个有约束力的协议,对策可分为合作对策与非合作对策。2. 如果在一个对策过程中,局中人之间的协议、承诺或威胁具有完全的约束力,并能够强制执行,称为合作对策,否则称为非合作对策。,第一节 对策特点,第五篇-第十六章 对策
5、论,8/30,2018/4/15,(二) 静态对策与动态对策1. 按照局中人决策时是否存在时间的先后次序,对策可分为静态对策与动态对策。2. 如果局中人同时进行决策选择,或者虽非同时但后行动者并不知道先行动者采取什么具体行动,称之为静态对策。当考虑时间因素,对策需要多阶段或重复地进行下去时,就称为动态对策。,第一节 对策特点,第五篇-第十六章 对策论,9/30,2018/4/15,(三) 完全信息对策与不完全信息对策1. 按照局中人事先是否拥有其他局中人决策方面的信息,对策可分为完全信息对策与不完全信息对策。2. 在完全信息对策中,每一位局中人都拥有所有其他局中人的特征、策略集合及收益函数方面
6、准确的信息;在不完全信息对策中,局中人只能了解上述信息中的一部分。,第一节 对策特点,第五篇-第十六章 对策论,10/30,2018/4/15,(四) 对抗性对策与非对抗性对策在对抗性对策中,局中人的收益或效用完全对立,一方所得必为另一方所失,一方利益的增加必然导致另一方利益的减少,局中人收益之和为零或常数。在非对抗性对策过程中,局中人有各自不同的收益值,其和可以是任意变数。在对抗性对策中,如果局中人各方不管采取何种策略,各自收益之和恒为零,则称之为零和对策;如果各自的收益之和为常数,则称之为常和对策;否则称之为变和对策。,第一节 对策特点,第五篇-第十六章 对策论,11/30,2018/4/
7、15,第一节 对策特点,在非对抗性对策过程中,局中人有各自不同的收益值,局中人之间的收益或效用既冲突又一致,具备达成某种均衡的可能。经济活动中的很多对策问题都属于非对抗性对策,而非对抗性对策也就构成了经济对策论研究的重点 。,第五篇-第十六章 对策论,12/30,2018/4/15,第二节 完全信息对策,一、完全信息静态对策标准型对策的基本要素对策的局中人名单;每个局中人的所有策略单;每个策略组合所对应的每个局中人的收益单。,第五篇-第十六章 对策论,13/30,2018/4/15,(一) 上策均衡(即占优均衡)1. 占优均衡:不管对策中其他局中人的策略是什么,对某一局中人来说,他所采取的策略
8、都是最优策略。2. 占优均衡就是所有局中人的占优策略的组合。例 囚徒困境:该对策占优均衡就是(坦白,坦白)。,第二节 完全信息对策,囚徒困境体现了个人理性和集体理性的矛盾,即个人利己,不一定导致帕累托最优,从而动摇了传统经济学中“经济人”假设,于是以对策论为基石,重构现代经济学理论大厦,已成为一个引人注目的重要研究领域。,第五篇-第十六章 对策论,14/30,2018/4/15,第二节 完全信息对策,(二) 纳什均衡纳什均衡:当给定其他局中人选择策略的前提下,每个人选择自己的最优策略,把所有局中人选择的最优策略组合起来,就构成纳什均衡。1. 纯策略纳什均衡例 新产品开发 例 性别大战,第五篇-
9、第十六章 对策论,15/30,2018/4/15,第二节 完全信息对策,2. 混策略纳什均衡混策略即局中人按照某一概率选择纯策略。例 石头、剪子、布:取胜原则:保守秘密和随机选择。,第五篇-第十六章 对策论,16/30,2018/4/15,第二节 完全信息对策,(三) 极大化极小均衡不管对方选择何种策略,我方选择的策略都是我方所能选择的各种最坏策略中的最好策略。结果虽非收益最大,但确保不是收益最小例 双寡头垄断:设R代表收益,则 ,为简单起见,假设企业A、B分别有两个策略,企业收益矩阵如下图。则均衡解为(a1,b1)=(5,5)。,第五篇-第十六章 对策论,17/30,2018/4/15,第二
10、节 完全信息对策,二、完全信息动态对策(一) 动态对策例市场进入阻扰模型若为静态对策,从收益矩阵可见存在两个纳什均衡:(进入,合作) 与(不进入,斗争) 。若为动态对策,根据逆向递推的思路,可剔除一纳什均衡(不进入,斗争) ,则动态对策中各局中人理性选择的唯一纳什均衡是(进入,合作)。,第五篇-第十六章 对策论,18/30,2018/4/15,逆推法:在一般的有限次对策中,逆推法均可用于求解均衡问题,即首先从对策树的末端开始,求解末端的子对策均衡,然后将求出的均衡解取代该子对策。在完全信息动态条件下,如果原对策的所有子对策均达到纳什均衡,则称整个对策均衡为子对策完美纳什均衡。承诺行动是指,局中
11、人使自己的威胁策略变成可以置信的行动。不可置信的威胁,则称空洞威胁。,第二节 完全信息对策,第五篇-第十六章 对策论,19/30,2018/4/15,(二) 重复对策重复对策是一种特殊的完全信息动态对策,指同样结构的对策重复多次。重复对策可能是有限次的,也可能是无限次的重复对策的均衡结果,往往与一次性对策不同,有限次对策的均衡结果,也与无限次重复对策的均衡结果不同。,第二节 完全信息对策,第五篇-第十六章 对策论,20/30,2018/4/15,例 无限重复囚徒困境囚徒困境重复进行无限次时假定(1) A,B均追求效用最大化,并用 U1,U2,Un 分别表示A在各 个子对策中获得的收益。(2)
12、A,B收益或效用的贴现系数为 a,且a=1/(1+i) ,其中i为利率。A在所有子对策中所获收益的贴现值之和可表示为 。,第二节 完全信息对策,第五篇-第十六章 对策论,21/30,2018/4/15,此时,局中人考虑的是所有未来收益的贴现值之和,而不是一次性的收益。如果A提出彼此抵赖的合作建议,并威胁说:如果你中途变卦,我也将一直坦白,对你惩罚。若施行威胁带来的重复对策贴现值之和,大于不施行威胁的重复对策贴现值之和,威胁变得可以置信。若A与B相互合作,均一直抵赖,可知在每一个子对策中A的收益值为U1=U2=Un=-1,设a=0.9,贴现值之和为同理,可得局中人B所获收益 的贴现值之和为uB=
13、-10。,第二节 完全信息对策,第五篇-第十六章 对策论,22/30,2018/4/15,若A与B不能相互合作,一直选择坦白策略,同样可以得到A与B在每一个子对策中所获收益贴现值之和 。由于UAUA,UBUB,说明双方进行合作的承诺是可以置信的。在无限重复的囚犯困境对策中,子对策完美纳什均衡应为(抵赖,抵赖) ,达到了个人利益与集体利益同时最优,囚犯困境的特征也随之消失。 如果重复的对策是有限次,则采用递推法可以证明,局中人将像一次性对策中那样,将选择(坦白,坦白),继续陷入困境之中。,第二节 完全信息对策,第五篇-第十六章 对策论,23/30,2018/4/15,第三节 不完全信息对策,一、
14、不完全信息静态对策例 不完全信息市场进入阻扰模型在前述市场进入阻挠模型中增加假定:(1) 在位者成本函数有两种类型:高成本与低成本;(2) 在位者有完全信息,进入者有不完全信息。图(a)存在两个纳什均衡:(进入,合作)与(不进入,斗争),其中(不进入,斗争)应予剔除。图(b)存在一个纳什均衡:(不进入,斗争)。,图5.16.9市场进入阻挠不完全信息静态模型,第五篇-第十六章 对策论,24/30,2018/4/15,如果进入者知道在位者为高成本,选择进入策略;如果知道在位者为低成本,选择不进入。若高成本概率为P,低成本概率为(1-P) 。 选择进入的预期收益为U1=P40+(1-P) (-10)
15、 =50P-10; 选择不进入的预期收益为U2=0P+0(1-P) =0。当进入者选择进入所获得的预期收益不小于选择不进入所获得的预期收益时,才会选择进入。即U1U2或50P-100,也就是说:当P20%时,进入者选择进入策略;当P20%时,进入者选择不进入策略。,第三节 不完全信息对策,第五篇-第十六章 对策论,25/30,2018/4/15,由于有限理性和信息壁垒,不完全信息常常成为局中人所处的现实环境。局中人并不具备其他局中人策略选择方面的完全信息,却具备其概率分布方面的完全信息,这种对策被称为完全但不完美信息对策。贝叶斯均衡表示这样一种策略组合:在给定局中人自己的类型及其他局中人类型概
16、率分布的情况下,每位局中人的预期收益或预期效用都达到最大化。,第三节 不完全信息对策,第五篇-第十六章 对策论,26/30,2018/4/15,二、不完全信息动态对策例 蜈蚣对策运用逆推法可得:局中人A在对策开始时将会直接选择D,结果是A与B各获得仅为1的收益。,第三节 不完全信息对策,第五篇-第十六章 对策论,27/30,2018/4/15,如果B具有完全信息,A具有不完全信息,对策进程见下图:,第三节 不完全信息对策,第五篇-第十六章 对策论,28/30,2018/4/15,B属于合作者的概率为P,则他属于短期利益至上者的概率可表示为(1-P) , P0,1。局中人A首先选择策略R时,预期
17、收益为U1=100P+0(1-P) =100P。当A首先选择策略D时,预期收益为U2=1P+1(1-P) =1。当U1U2或100P1时,A首先选择R所获得的预期收益不小于选择D所获得的预期收益,他会先选择R。此对策的一个纳什均衡是:不管B属于哪种类型,在前面的子对策阶段里,A将选择R,B将选择r, (R,r)也是唯一可置信的纳什均衡。在不完全信息动态对策问题中,这种均衡被称为完美贝叶斯均衡。,第三节 不完全信息对策,第五篇-第十六章 对策论,29/30,2018/4/15,本章目录,第十六章 对策论 第一节 对策特点第二节 完全信息对策第三节 不完全信息对策第十六章 结束,第五篇-第十六章 对策论,30/30,2018/4/15,【问题讨论】“谋事在人,成事在天”。你看呢?“上有政策,下有对策”。对不对?,