收藏 分享(赏)

6对策模型.ppt

上传人:ysd1539 文档编号:7016619 上传时间:2019-05-01 格式:PPT 页数:24 大小:372KB
下载 相关 举报
6对策模型.ppt_第1页
第1页 / 共24页
6对策模型.ppt_第2页
第2页 / 共24页
6对策模型.ppt_第3页
第3页 / 共24页
6对策模型.ppt_第4页
第4页 / 共24页
6对策模型.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、第六节 博弈中的对策模型,对策与决策是人们生活和工作中经常会遇到的择优活动。人们在处理一个问题时,往往会面临几种情况,同时又存在几种可行方案可供选择,要求根据自己的行动目的选定一种方案,以期获得最佳的结果。,有时,人们面临的问题具有竞争性质,如商业上的竞争、体育中的比赛和军事行动、政治派别的斗争等等。这时竞争双方或各方都要发挥自己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手做出自己的决择,此时的决策称为对策。在有些情况下,如果把可能出现的若干种情况也看作是竞争对手可采取的几种策略,也可以把决策问题当作对策问题来求解。,对策问题的特征:参与者为利益相互冲突的各方,其结局不

2、取决于其中任意一方的努力,而是各方所采取的策略的综合结果。,几个实际例子,例1 (田忌赛马),传说战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。,例2 (石头剪子布),这是一个大多数人小时候都玩过的游戏。游戏双方只能选石头、剪子、布中的一种,石头赢剪子,剪子赢布,而布又赢石头,赢者得一分,输者失一分,双方相同时不得分,见下表(1)。,例3 (囚犯的困惑)

3、,警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以使用和持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方将被判刑7年。将嫌疑犯A、B被判刑的几种可能情况列表如下:,表中每对数字表示嫌疑犯A、B被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。,表(2),一、对策的基本要素,(1)局中人:参加决策的各方称为决策问题的局中人,一个决策可以包含两名局中

4、人(如棋类比赛、人与大自然作斗争等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争)。局中人必须要拥用可供其选择并影响最终结局的策略,在例3中,局中人是A、B两名疑犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各自采取的态度,警方不能为他们做出选择。,从这些简单实例中可以看出对策现象中包含的几个基本要素。,(2)策略集合: 局中人能采取的可行方案称为策略,每一局中人可采取的全部策略称为此局中人的策略集合。对策问题中,对应于每一局中人存在着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所

5、谓策略是指在整个竞争过程中对付他方的完整方案,并非指竞争过程中某步所采取的具体局部办法。,例如:下棋中的某步只能看和一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策,否则称为无限对策。,记局中人i的策略集合为Si。当对策问题各方都从各自的策略集合中选定了一个策略后,各方采取的策略全体可用一矢量S表示,称之为一个纯局势(简称局势)。,例如,若一对策中包含A、B两名局中人,其策略集合分别为SA= 1, m ,SB = 1, n 。若A选择策略 i ,而B选策略 j,则( i, j)就构成

6、此对策的一个纯局势。显然,SA与SB一共可构成mn个纯局势,它们构成下表。对策问题的全体纯局势构成的集合S称为此对策问题的局势集合。,(3)赢得函数(或称支付函数):对策的结果用向量表示,称之为赢得函数。赢得函数F为定义在局势集合S上的矢值函数,对于S中的每一纯局势S,F(S)指出了每一局中人在此对策结果下应赢得(或支付)的值。,综上:一个对策模型由局中人、策略集合和赢得函数三部分组成。记局中人集合为I = 1,k,对每一iI,有一策略集合Si,当I中每一局中人i选定策略后得一个局势s;将s代入赢得函数F,即得一矢量F(s)=(F1(s),Fk(s),其中Fi(s)为在局势s下局中人i的赢得(

7、或支付)。,这里讨论只有两名局中人的对策问题,即二人对策,其结果可以推广到一般的对策模型中去。对于只有两名局中人的对策问题,其局势集合和赢得函数均可用表格表示。,二、二人零和对策,存在一类特殊的对策问题。在这类对策中,当纯局势确定后,A的所得恰为B的所失,或者A的所失恰为B的所得,即双方所得之和总为零。在零和对策中,因F1(s)=F2(s),只需指出其中一人的赢得值即可,故赢得函数可用赢得矩阵表示。例如若A有m种策略,B有n种策略,赢得矩阵,表示若A选取策略i而B选取策略j,A的所得为aij(当aij0时为支付)。,在二人对策的赢得表中,A的所得并非明显为B的所失,但双方赢得数之和为一常数。无

8、论A、B怎样选取策略,双方赢得总和均为10。此时,若将各人赢得数减去两人的平均赢得数,即可将赢得表化为零和赢得表。表(3)中的对策在转化为零和对策后,具有赢得矩阵。,表(3),给定一个两人对策只需给出局中人A、B的策略集合SA、SB及表示双方赢得值的赢得矩阵R。,二人对策 G 又可称为纯矩阵对策 记成 G = SA, SB, R ,从R中可以看出,若A希望获得最大赢利30,需采取策略 1,但此时若B采取策略 4,A非但得不到30,反而会失去22。为了稳妥,双方都应考虑到对方有使自己损失最大的动机,从最坏的可能中争取最好的结果。局中人A采取策略 1、 2、 3时,最坏的赢得结果分别为,例4 给定

9、G =SA ,SB ,R,其中SA = 1, 2, 3, SB = 1, 2, 3, 4 ,min 12, 6, 30, 22 = 22,min 14, 2, 18, 10 =2,min 6, 0, 10, 16 = 10,其中最好的可能为max22,2,10=2。如果A采取策略 2,无论B采取什么策略,A的赢得均不会少于2.,B采取各方案的最大损失为max12,14,6=14,max 6,2,0= 2,max30,18,10 = 30和max22,10,16=16。当B采取策略 2时,其损失不会超过2。注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定解.(也被称为鞍点),满足上式的 的相应策略 与 分别为G的局中人A与B的最优策略。,定理 对于两人对策G = SA, SB, R,有解的充要条件是,双方如何选派队参赛?,例5 甲、乙两国举行乒乓求友谊赛,甲国有四个队,乙国有三个队,根据以往比赛记录,甲国得分的赢得矩阵为,R=,解:由,故,可知,有,可见甲国派二队,乙国派一队参赛分别是双方的最优策略。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 大学论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报