1、第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学),第九章 博弈论-无处不在的游戏,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。保罗萨缪尔森,一、博弈论的基本概念 1、定义:博弈论(game theory),又称对策论,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。,第一节 博弈论的基本概念与分类,通俗地讲,博弈论是一种“游戏理论”。其准确的定义是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中
2、各自取得相应结果或收益的过程。,续上页,2、博弈论的演进 (1)早期博弈论的萌芽(田忌赛马) (2)合作型博弈(冯诺依曼与摩根斯特恩于1944年合著博弈论和经济行为); (3)非合作博弈(纳什均衡); (4)20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用。,附:纳什其人,3、博弈论模型简介博弈论模型可以用五个方面来描述 GP,A,S,I,U P(player): 为局中人,博弈的参与者,也称为“博弈方”,局中人以最终实现自身利益最大化为目标。 A(action) :为各局中人的所有可能的策略或行动的集合。根据该集合是有限还是无限,可分为有限博弈和无限博弈。 S(
3、strategies) :博弈的进程,也是博弈进行的次序。静态博弈与动态博弈。,I(information) :博弈信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈。反之为不完全信息博弈。 U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。,二、博弈的分类 1、按照参与人之间是否合作进行分类,博弈可分为合作博弈和非合作博弈。 合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行的博弈。反之,就是非合作博弈。 前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己
4、的收益最大,即策略选择问题,强调的是个人理性。,2、在非合作博弈中,按照参与人的先后顺序进行分类,又可分为静态博弈和动态博弈。 静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。,3、按照参与人对其他参与人的了解程度进行分类,博弈可分为完全信息博弈和不完全信息博弈。 完全信息博弈是指:在每个参与人对所有其他参与人的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。 如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情
5、况下进行的博弈就是不完全博弈。,第一节 博弈论的基本概念与分类,博弈的分类及对应的均衡概念,第一节 博弈论的基本概念与分类,行动顺序,完全信息,动 态,静 态,不完全信息,完全信息静态博弈,信 息,不完全信息静态博弈,完全信息动态博弈,不完全信息动态博弈,纳什均衡,贝叶斯纳什均衡,精炼贝叶斯纳什均衡,子博弈精炼纳什均衡,一、完全信息静态博弈 二、完全信息动态博弈,第二节 完全信息博弈,一、完全信息静态博弈:纳什博弈论的原理与应用 、占优策略均衡无论其他参与人如何选择自己的策略,该参与人的最优策略选择是惟一的。 (1)经典案例:囚徒困境“囚犯困境”讲的是两个同案犯罪嫌疑犯(囚徒)被警方拘捕后,为
6、防其相互间串供,而分别拘捕、隔离审问时,两疑犯所面临的认罪策略选择的问题。,在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战略的基础上达到均衡。这种均衡称为占优战略均衡。在上表中的“A坦白,B也坦白”就是占优战略均衡 (2)条件:占优策略虽然要求每个参与人是理性的,但并不要求每个参与人知道其他参与人也是理性的。,(3) “囚犯困境”的意义: 首先对亚当斯密的“看不见的手”的原理提出挑战。个人理性与集体理性的冲突。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。从“纳什均衡”引出一个悖论:从利己目的出发,结果损人不利己。两个囚徒的命
7、运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石 。 其次可悟出一条真理:合作是有利的“利己策略”。,(4)应用: 奥尔森的集体行动的逻辑多人囚犯两难博弈 (n-person prisoners dilemma games),成为非合作博弈论的一个重要分支。,重复剔除的占优策略均衡 (1)智猪博弈按按钮对于吃食量的影响,第二节 完全信息博弈,智猪博弈,第二节 完全信息博弈,重复剔除的占优策略均衡首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策略
8、组合为止。剩下的这个惟一的参与人组合,就是这个博弈的均衡解。 严格劣策略:是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。 (2)应用:集体行动出现的条件之一是集体成员的不对称。,第二节 完全信息博弈,3纳什均衡 在这一均衡中,每个参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。纳什均衡是完全信息静态博弈解的一般情况。,第二节 完全信息博弈,性 别 战,第二节 完全信息博弈,第二节 完全信息博弈,一、完全信息动态博弈: 、子博弈精练纳什均衡房地产开发博弈(静态),第二节 完全信息博弈,在行动开始前的A看来,如果不计得
9、失,B有四种战略可选择。,第一,无论A是否开发,B都要开发。 第二,如果A开发,B也开发;如果A不开发,B也不开发。 第三,如果A开发,B就不开发;如果A不开发 ,B就开发。 第四,无论A是否开发,B必定开发。,第二节 完全信息博弈,先行动者A对B预测结果的收益矩阵,第二节 完全信息博弈,只有当某一战略组合在每一个子博弈上都构成一个纳什均衡,这一战略组合才是子博弈精练纳什均衡。,第二节 完全信息博弈,2、重复博弈 (1)定义:是指同样结构的博弈重复许多次,其中每次博弈称为阶段博弈。 (2)影响重复博弈均衡结果的主要因素:博弈重复的次数和信息的完备性。 (3)博弈重复次数为无限次与冷酷策略博弈重复次数为有限次时每个阶段博弈的均衡解都是一次性博弈的纳什均衡解。,第二节 完全信息博弈,3、 动态博弈战略行动 在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。这些行为称为战略行动。它主要包括: (1)先行优势 (2)确信威胁(承诺行动) 它是指博弈的参与人通过某种行动改变自己的支付函数,从而使自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺。,完,