1、第十章 博弈论初步,2019/3/19,1,第一节 博 弈 论概述,博弈论(Game Theory) 也称对策论,是描述和研究行为者之间策略相互依存和相互作用的一种决策理论。 博弈论被广泛应用于政治、外交、军事、管理、经济等领域。,2019/3/19,2,1.1博弈的三要素 博弈论三要素:参与者、策略和支付 参与者:博弈中进行决策的个体。 策略:是一项规则,根据这个规则参与者在博弈的每一个时点上选择如何行动。 人不犯我,我不犯人;人若犯我,我必犯人。 支付:指所有参与者都选择了自己的策略且博弈已经完成之后,参与者所获得的效用(可能是期望效用)。,1.2 博弈举例,囚徒困境集体理性和个体理性的矛
2、盾。 社会理性和集体理性的矛盾。,2019/3/19,4,军备竞赛博弈,2019/3/19,5,美国的决策 (U.S.),军备,军备,裁军,裁军,苏联USSR 的决策,),第二节 同时博弈:纯策略均衡,乙合作 不合作合作 (5,6) (1,5) 甲不合作 (7,1) (2,3) 甲的条件策略:不合作/合作,不合作/不合作 甲的条件策略组合:(不合作,合作),(不合作不合作) 乙的条件策略:合作/合作,不合作/不合作 甲的条件策略组合:(合作,合作),(不合作,不合作),2.1纳什均衡,纳什均衡指的是参与人的这样一个策略组合,在该策略组合上,任何一参与人单独改变不会得到好处。 划线法:如果两个数
3、字下均画有线,则两个参与人都没有改变策略的动机;此时对应的策略组合就是纳什均衡,2.2纳什均衡及划线法举例,2019/3/19,8,博弈均衡指博弈中的所有参与者都不想改变自己的策略的这样一种相对静止的状态,2.3纳什均衡的存在性,乙左 右上 (4,6) (9,1) 甲下 (7,3) (2,8),2.4纳什均衡的惟一性乙左 右上 (5,6) (1,4) 甲下 (4,1) (2, 3 ),2.4唯一性举例,2019/3/19,11,性别战,2.5最优性(帕累托的标准) 列抵赖 坦白抵赖 (-1,-1) (-10,0) 行 坦白 (0,-10) (-8,-8)很明显(-1,-1) 是优于(-8,-8
4、),2.6占优策略及占优策略均衡,占优策略:无论其他参与者采取什么策略,某参与者只有唯一的最优策略。 优势策略均衡:不管其他人采取什么策略,每个博弈者都会找到对自己最有利的策略所构成的一个策略组合。,2019/3/19,13,2.7 重复博弈和均衡,重复博弈 有限次重复博弈 无限次重复博弈 对未来的重视程度 博弈的终点,2019/3/19,14,第三节 序贯博弈,3.1概述 序贯博弈:参与人的决策和行动有先后顺序的博弈,即后行动的参与人观测到先行动的参与人已经采取的策略。 博弈树:另外一种表示序贯博弈的方法。 结(node)是指博弈中某一参与人或自然采取行动的时点或博弈结束的时点。 起点结是指
5、不存在前续结的结。 终点结是指不存在后续结的结。,3.2逆向归纳法,第一步:从博弈的最后阶段的每一个结点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈 第二步:对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简化博弈。 第三步:根据最简化博弈找出最优解。,逆向归纳法举例: 情侣博弈之男方先动,男,女,女,足球,芭蕾,足球,芭蕾,足球,芭蕾,(2,1),(0, 0),(-1,-1),(1, 2),逆向归纳法举例: 情侣博弈之男方先动,男,女,女,足球,芭蕾,足球,芭蕾,足球,芭蕾,(2,1),(0, 0),(-1,-1),(1, 2),(2,1),逆向归纳法举例: 情侣博弈之男方先动,男,女,女,足球,芭蕾,足球,芭蕾,足球,芭蕾,(2,1),(0, 0),(-1,-1),(1, 2),(2,1),(1, 2),逆向归纳法举例: 情侣博弈之男方先动,男,女,女,足球,芭蕾,(2,1),(1, 2),情侣博弈之女方先动,女,男,男,足球,芭蕾,足球,芭蕾,足球,芭蕾,(1,2),(0, 0),(-1,-1),(2, 1),逆向归纳法举例: 情侣博弈之男方先动,女,男,男,芭蕾,足球,(1,2),(2, 1),信息,对后动方来说,信息的获得使他陷入被动。信息并不是越多越有利,