1、NEUQ1对策论Game Theory“ 理智人 ” 间的竞争策略NEUQ2二、引言三、矩阵对策 对策现象 对策论 对策问题的三个基本要素 对策问题的分类 具有鞍点的矩阵对策 无鞍点的矩阵对策 最优混合策略的解法本章主要内容一、对策论导论NEUQ3博弈论导论 博弈论的演化历程 最早的对策论思想产生于中国春秋时期,孙武的 孙子兵法 现代经济博弈论起源可以追溯到 1944年,由美国著名数学家冯 诺依曼( John Neumann)与经济学家奥 摩根斯坦( Oscar Morgensten)合著的 博弈论与经济行为 NEUQ4 1994:纳什( Nash)、海萨尼( J.Harsanyi)、泽尔腾(
2、 R.Selten) 1996莫里斯( James A.Mirrlees)和维克瑞( William Vickrey)纳什的基本贡献是证明了非合作博弈均衡解及其存在性,建立了作为博弈论基础的“纳什均衡”概念;海萨尼则把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。博弈论导论 博弈论和诺贝尔经济学奖NEUQ5这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖,以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系,拓宽了其
3、经济解释范围。贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。博弈论导论 博弈论和诺贝尔经济学奖 2001:阿克洛夫( Akerlof)、斯宾塞( Spence)、斯蒂格利茨( Stiglitz) 2002:弗农史密斯( Smith) 2005:奥曼( Aumann)、谢林( Schelling)NEUQ6约翰 纳什1928年生于美国约翰 纳什( JO
4、HN F.NASH)美国人 (1928- ),由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得 1994年诺贝尔经济奖。纳什均衡(完全信息静态博弈 )卡内基 梅隆大学科学硕士、普林斯顿大学数学博士。 主要研究领域: 博弈论 和微分几何学 。主要贡献:非合作博弈均衡、经济博弈论NEUQ7约翰 福布斯 纳什NEUQ8 美丽心灵 是一部关于一个真实天才的极富人性的剧情片。故事的原型是数学家小约翰 -福布斯-纳什 (Nash),普林斯顿大学的著名教授,诺贝尔经济学奖的获得者 (1994年 ),他在博弈理论方面的巨大发现甚至改变了我们的日常生
5、活。但另一方面,纳什也是一个悲剧人物,他的一生为精神分裂症所困。在历经苦痛的人生里,纳什一方面在运用自己那优美绝伦的大脑,另一方面也在与他的大脑进行着顽强的抗争。最终理性为他带来了心灵的和平,纳什终于摘取了科学事业上的桂冠。NEUQ9囚徒困境问题纳什均衡: (坦白,坦白)-1, -1-10, 00, -10-8 , -8囚徒 B坦白 抵赖坦白抵赖囚徒 A坦白从宽,抗拒从严著名博弈问题NEUQ10市场进入阻挠0, 3000, 300-10, 040, 50在位者默许 斗争进入不进入进入者纳什均衡: (进 入,默许)(不进入,斗争)著名博弈问题NEUQ11智 猪 博 弈按钮食槽著名博弈问题NEUQ
6、12假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有 10个单位的猪食进槽,但是谁按按钮就会首先付出 2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是91 ;同时到槽边,收益比是 73 ;小猪先到槽边,收益比是 64 。那么,在两头猪都有智慧的前提下, 最终结果是小猪选择? 。NEUQ13小猪行动 等待大猪 行动 5 1 4 4等待 9 -1 0 0小猪的选择将是等待NEUQ14齐王赛马著名博弈问题齐王与田忌赛马 .双方约定 : 从各自的上中下三个等级的马中各选一匹参赛 ; 每匹马只能参赛一次 ; 每次比赛双方各出一匹马 ,负者要付给胜
7、者千金 .不同等级的马 ,高等级优于低等级 ;同等级的马中 ,齐王的马优于田忌的马 ;如何对策 ?NEUQ15引言对策现象 各种比赛:体育、棋类等比赛 政治方面:外交谈判 经济方面:贸易谈判、争夺市场、各种经营竞争等具有竞争或对抗性质的现象NEUQ16对策论对策论是关于相互影响的决策者的研究。是研究具有竞争或者对抗性质现象的理论与方法。 研究对策现象的一种定量分析理论与方法。也称为博弈论参加竞争或对抗的各方具有不同的利益和目标,为了达到各自的利益和目标,各方必须考虑对手的各种可能的行动方案,并力图选择对自己最有利或最合理的方案。NEUQ17对策问题的三个基本要素1 局中人 ( players)
8、一个对策中有权决定自己行动方案的对策参加者称为 局中人 。 通常用 I表示局中人的集合 , 如果有 n个局中人 , 则 I 1,2, ,n。对策论中对局中人的一个重要的假设:每个局中人都是 “ 理性的 ” 、等智力的。2策略( strategies)对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。一般每个局中人的策略集 S中至少应包括两个策略。NEUQ18如“齐王与田忌赛马”中:齐王有 6个策略: (上中下 ), (上下中 ), (中上下 ), (中下上 ),(下上中 ), (下中上 )田忌有 6个策略: (上中下 ), (上下中 ), (中上下 ), (中下上 ),(下上中
9、 ), (下中上 )3.赢得函数 (支付函数 )( payoff function)局势: 每个局中人从各自的策略集合中选取一个策略参加对策,形成的一个处于竞争的策略组。如:齐王选策略 (上中下 ), 田忌选策略 (中上下 ),构成一个局势 (上中下 ), (中上下 )。局势的得失总和为 0。一局对策的得失,即局中人的得失。叫 赢得(支付)函数 ,对有限策略集,叫 赢得(支付) 矩阵 。NEUQ19设 si是第 i个局中人的一个策略 , 则 n个局中人的策略形成的策略组合 s (s1, s2, ,sn)就是一个局势 。 若记 S为全部局势的集合 , 则S S1 S2 Sn当一个局势 s出现后
10、, 应该为每一局中人 i规定一个赢得值(或所失值 )Hi(s)。 显然 , Hi(s)是定义在 S上的函数 , 称为局中人 i的赢得函数 。 在 “ 齐王赛马 ” 中 , 局中人集合 I 1,2, 齐王和田忌的策略集可分别用表示 。 这样 ,齐王的任一策略 i和田忌的任一策略 j就构成了 个局势 sij, 如果 1=(上 ,中 ,下 ), l (上 ,中 ,下 ) 则在局势 s11下 , 齐王的赢得为 H1(s11) 3, 田忌的赢得为 H2(s11)= -3当局中人 、 策略集和赢得函数这 3个要素确定后 , 一个对策模型也就给定了 。1 1 2 6 2 1 2 6 , , , , , ,
11、SS LL、NEUQ20例:两个赌博参加者甲 、 乙各出示一枚硬币 ,在不让对方看见的情况下 , 将硬币放在桌子上 , 若两个硬币都呈正面或都呈反面则甲得 1元 , 乙付出 1元;若两个硬币一个呈正面另一个呈反面则乙得 1元 , 甲付出 1元 。局中人: 甲 、 乙策略: si=正面 , 反面 i=1,2局势: S=(正 ,反 ), (正 ,正 ), (反 ,正 ), (反 ,反 )支付函数: H1(正 ,反 )= -1, H1(正 ,正 )=1, H1(反 ,正 )= -1, H1(反 ,反 )=1, H2(正 ,反 )= 1, H2(正 ,正 )= -1, H2(反 ,正 )=1, H2(
12、反 ,反 )= -1NEUQ21对策问题的分类对策动态对策静态对策结盟对策不结盟对策微分对策联合对策合作对策有限无限二人多人二人多人零和非零和零和非零和零和非零和零和非零和NEUQ22矩阵对策二人有限零和对策(对抗对策): 局中人 2个 每个局中人的策略集中的策略数目有限 每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。NEUQ231(上中下 )2(上下中 )3(中上下 )4(中下上 )5(下上中 )6(下中上 )1(上中下 ) 3 1 1 1 1 -12(上下中 ) 1 3 1 1 -1 13(中上下 ) 1 -1 3 1 1 14(中下上 ) -1 1 1 3
13、1 15(下上中 ) 1 1 -1 1 3 16(下中上 ) 1 1 1 -1 1 3齐王田忌aijNEUQ24例: 某单位秋季决定冬季取暖用煤的贮量 。 冬季用煤贮量在较暖 、 正常和较冷情况下分为 10、 15和 20吨 。 设冬季煤价也随寒冷程度而变 , 在上述三种情况下分别为 100、 150和 200元 /吨 , 已知秋季煤价为 100元 /吨 , 冬季气象未能予知 , 问秋季合理贮煤量为多少 ?设局中人甲为:贮煤量决策者;局中人乙为:未来冬季气候 。 费用总和 =秋季贮煤量费用 +冬季补购煤量费用1(较暖 )2(正常 )3(较冷 )1(10 吨 ) -(10 100)=-1000-
14、(10 100+5 150)=-1750-(10 100+10 200)=-30002(15 吨 ) -(15 100)=-1500-(15 100)=-1500 -(15 100+5 200)=-25003(20 吨 ) -(20 100)=-2000-(20 100)=-2000 -(20 100)=-2000甲乙aij则赢得矩阵为:200020002000250015001500300017501000ANEUQ25NEUQ26矩阵对策问题解的假设:例:设有一矩阵博弈 G=S1, S2; H,其中310186H= 具有鞍点的矩阵对策NEUQ27如果双方部不想冒险、都不存在侥幸心理,而是考
15、虑到对方必然会设法使自己所得最少这一点,就应该 从各自可能出现的最不利的情形中选择一个最有利的情形作为决策的依据 ,这就是所谓“理智行为”,也是对策双方实际上可以接受并采取的一种稳妥的方法。从各自可能出现的最不利的情形中选择一个最有利的情形作为决策的依据22ijji a=am i nm a x局中人 1局中人 222ijij a=am a xm i n310186H=4321321 310186H=4321321 NEUQ28定义 1: 设 G=S1, S2; H为一矩阵博弈,其中 S1= 1, 2, m, S2= 1, 2, n, H=(aij)m n,若等式=am i nm a x ijj
16、i * jiijij a=am a xm i n成立。记 ,称 vG为博弈 G的值,使上式成立的纯局势 为纯策略下的解, 分别称为局中人 1, 2的最优纯策略。* jiG a=v),( * ji * ji 与定理 1 矩阵博弈 G=S1, S2; H在纯策略意义下有解的充要条件是:存在纯局势 ,使得对任意 i和 j,有),(* ji jijiij * a a a NEUQ29充分性:* * * *m ax m inm in m ax m axm in m ax m inm in m ax m ax m in, m in m axm ax m in m in m axm ax m in m in
17、 m axij i j i jjiijijj iiijijjijij ijijjjiiij ij ijj iij ijjjiiij ij Gijjjiia a aaaaaa a ai j a a aaaa a a V QNEUQ30* * * * * * * * * * *,m in m ax m inm ax m in m axm ax m in m in m axm ax m in m ax m in, m ax m inijijjj iijijjiiij ijjjiiij i j i j ij i jjjiiij ij i j i j i jjiijaaaaaaa a a a ai j a a a a a Q*设 有必要性: