收藏 分享(赏)

第11章 对策论.ppt

上传人:dwy79026 文档编号:8460624 上传时间:2019-06-28 格式:PPT 页数:23 大小:250KB
下载 相关 举报
第11章  对策论.ppt_第1页
第1页 / 共23页
第11章  对策论.ppt_第2页
第2页 / 共23页
第11章  对策论.ppt_第3页
第3页 / 共23页
第11章  对策论.ppt_第4页
第4页 / 共23页
第11章  对策论.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、第11章 对策论,11.1 对策论基本概念 11.2 矩阵对策的最优纯策略 11.3 矩阵对策的混合策略 11.4 矩阵对策的矩阵降维,对策模型的三个基本要素: 1.局中人:参与对抗的各方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集; 3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。,10.1 对策论基本概念,分类 (1)根据局中人的个数,分为二人对策和多人对策; (2)根据各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对策; (3)根据局中人是否合作

2、,又可分为合作对策和非合作对策; (4)根据局中人的策略集的个数,又分为有限对策和无限对策(或连续对策); (5)也可根据局中人掌握信息的情况可分为完全信息对策、非完全信息对策 (6)决策的行动顺序可分为静态对策、动态对策 (7)根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策。,一、完全信息静态对策该对策是指掌握了参与人的特征、战略空间、支付函数等知识和信息并且参与人同时选择行动方案或虽非同时但后行动者并不知道前行动者采取了什么行动方案。纳什均衡是一个重要概念。在一个战略组合中,给定其他参与者战略的情况下,任何参与者都不愿意脱离这个组合,或者说打破这个僵局

3、,这种均衡就称为纳什均衡。,二、完全信息动态对策在完全信息静态对策中,假设各方都同时选择行动。现在情况稍复杂一些。如果各方行动存在先后顺序,后行的一方会参考先行者的策略而采取行动,而先行者也会知道后行者会根据他的行动采取何种行动,因此先行者会考虑自己行动会对后行者的影响后选择行动。这类问题称为完全信息动态对策问题。,三、多人非合作对策 有三个或三个以上对策方参加的对策就是“多人对策”。多人对策同样也是对策方在意识到其他对策方的存在,意识到其他对策方对自己决策的反应和反作用存在的情况下寻求自身最大利益的决策活动。因而,它们的基本性质和特征与两人对策是相似的,我们常常可以用研究两人对策同样的思路和

4、方法来研究它们,或将两人对策的结论推广到多人对策。但多人对策中出现了更多的追求各自利益的独立决策者,策略的相互依存关系也就更为复杂,对任一对策方的决策引起的反应也就要比两人对策复杂得多。与两人对策有本质区别的特点,即可能存在“破坏者”:其策略选择对自身的得益没有任何影响,但却会影响其它对策方的得益,有时这种影响甚至有决定性的作用。,四、非零和对策零和对策:一方的收益必定是另一方的损失。这种对策的特点是不管各对策方如何决策,最后各对策方得益之和总是为零。虽不等于0,但总是等于一个非零常数,称之为“常和对策”。可以将零和对策本身看作是常和对策的特例。“零和对策”和“常和对策”之外的所有对策都可被称

5、为“非零和对策”。非零和对策即意味着在不同策略组合(结果)下各对策方的得益之和一般是不相同的。如前述囚徒困境就是典型的非零和对策。非零和对策是最一般的对策类型,而常和对策和零和对策都是它的特例。在非零和对策中,存在着总得益较大的策略组合和总得益较小的策略组合之间的区别,这也就意味着在对策方之间存在着互相配合,争取较大的总得益和个人得益的可能性。,二人有限零和对策(又称矩阵对策):局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。通常将矩阵对策记为: G = S1, S2, AS1:甲的策略集; S2:乙的策略集; A

6、:甲的赢得矩阵。,10.2 矩阵对策的最优纯策略,在甲方的赢得矩阵中: A=aijmn i 行代表甲方策略 i=1, 2, , m;j 列代表乙方策略 j=1, 2, , n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的益损值。此时乙方的益损值为 -aij(零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。“齐王赛马”是一个矩阵策略。,“齐王赛马”齐王在各局势中的益损值表(单位:千金),其中:齐王的策略集: S1= 1, 2, 3, 4, 5, 6 ,田忌的策略集:S2= 1,

7、2, 3, 4, 5, 6 。下面矩阵称齐王的赢得矩阵:3 1 1 1 -1 11 3 1 1 1 -1A= 1 -1 3 1 1 1-1 1 1 3 1 11 1 1 -1 3 11 1 -1 1 1 3,例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分。甲队的策略集为S1=1,2,3,乙队的策略集为S2=1,2,3。根据以往比赛的资料,有甲队的赢得矩阵为A,如下所示,请问这次比赛各队采用哪种阵

8、容上场最为稳妥?,矩阵A中每行的最小元素分别为1,-3,-1。在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手采取何策略,甲队至少得1分。对于乙队,1,2,3可能带来的最少赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取2策略,确保甲队不会超过1分。1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。这种最优纯策略只有当赢得矩阵A=(aij)中等式成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯策略下的解,又称(1,2)为对策G的鞍点。把其值V称之为对策G=S1,S2,A的值。,设矩阵对策 G = S1, S2, A

9、 。当 时,不存在最优纯策略。例:设一个赢得矩阵如下: min5 9 5A = max 6 策略2 8 6 6 imax 8 9 min 8 策略1j,10.3 矩阵对策的混合策略,当甲取策略2 ,乙取策略1时,甲实际赢得8比预期的多2,乙当然不满意。考虑到甲可能取策略2这一点,乙采取策略2。若甲也分析到乙可能采取策略2这一点,取策略1,则赢得更多为9 。此时,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即 一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)-即混合策略。,求

10、解混合策略的问题有图解法、迭代法、线性方程法和线性规划法等,我们这里只介绍线性规划法,其他方法略。例:设甲使用策略1的概率为x1,使用策略2的概率为x2 ,并设在最坏的情况下,甲赢得的平均值为V(未知)。5 9A= STEP 18 6 1) x1+x2=1x1, x20,2)无论乙取何策略,甲的平均赢得应不少于V: 对乙取1: 5x1+ 8x2 V 对乙取2: 9x1+ 6x2 V 注意 V0,因为A各元素为正。 STEP 2 作变换: x1= x1/V ; x2= x2/V 得到上述关系式变为:x1+ x2=1/V (V愈大愈好)待定5x1+ 8x219x1+ 6x21x1, x20,建立线

11、性模型:min x1+x2s.t. 5x1+8x21 x1= 1/219x1+6x21 x2= 2/21x1, x20 1/V= x1+x2=1/7所以,V=7 返回原问题: x1= x1V= 1/3x2= x2V= 2/3 于是甲的最优混合策略为: 以1/3的概率选1, 以2/3的概率选2,最优值V=7。,同样可求乙的最优混合策略: 设乙使用策略1的概率为 y1 y1+y2=1 设乙使用策略2的概率为 y2 y1, y20设在最坏的情况下,甲赢得的平均值为V。这也是乙损失的平均值,越小越好。作变换: y1= y1/V , y2= y2/V建立线性模型:max y1+y2s.t. 5y1+9y

12、21 y1= 1/148y1+6y21 y2= 1/14y1, y20 1/V= y1+y2=1/7所以,V=7,返回原问题: y1= y1V = 1/2y2= y2V = 1/2 于是乙的最优混合策略为: 以 1/2 的概率选1;以 1/2 的概率选2 ,最优值 V=7。当赢得矩阵中有非正元素时,V0 的条件不一定成立,可以作下列变换: 选一正数 k,令矩阵中每一元素加上 k 得到新的正矩阵A,其对应的矩阵对策 G= S1, S2, A 与 G = S1, S2, A 解相同,但VG = VG k。,优超原则:假设矩阵对策 G = S1, S2, A 甲方赢得矩阵 A=aijmn 若存在两行

13、(列),s 行(列)的各元素均优于 t 行(列)的元素,即 asjatj j=1,2 n ( ais ait i=1,2 m ) 称甲方策略s优超于t ( s优超于t)。优超原则:当局中人甲方的策略t被其它策略所优超时,可在其赢得矩阵A中划去第t行(同理,当局中人乙方的策略t被其它策略所优超时,可在矩阵A中划去第t列)。如此得到阶数较小的赢得矩阵A,其对应的矩阵对策 G= S1, S2, A 与 G = S1, S2, A 等价,即解相同。,10.4 矩阵对策的矩阵降维,例. 设甲方的益损值,赢得矩阵为3 2 0 3 0 被第3、4行所优超5 0 2 5 9 被第3行所优超 A= 7 3 9

14、5 94 6 8 7 5.56 0 8 8 3 得到7 3 9 5 9 被第1列所优超 A1= 4 6 8 7 5.5 被第2列所优超6 0 8 8 3,得到 7 3 9A2= 4 6 5.56 0 3 被第1行所优超 得到7 3 9 被第1列所优超A3= 4 6 5.57 3 最终得到 A4= 4 6,对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5X*= (0,0,1/3 ,2/3 ,0)T 乙: Y* = (1/10,1/10,0,0,0)T V=5Y*= (1/2 ,1/2 ,0,0,0)T 。 注: 利用优超原则化简赢得矩阵时,有可能将原对策问题的解也划去一些(多解情况); 线性规划求解时有可能是多解问题。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报