1、第15章 对策论基础,Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。二人有限零和对策是对策论(Game Theory)最基本的内容。,第一节 基本概念,一、对策现象与对策论,1. 对策现象,下棋:围棋源于我国殷代。,2 . 对策论的产生,1944年,纽曼与曼彻斯特发表了题为对策论和经济行为。二次大战前后,由于军事需要,抽象成数学模型。50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时,非
2、合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了“囚徒困境”问题。60年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。,二 、对策问题的组成,1.局中人(参加者):一局对策的参加者,理性假设。,3. 局势:在一局对策中,每个局中人都选定一策略后的各 策略总和。,4. 赢得函数:局势给定后,局中人的得失(是局势的函数)。,如在二人对策中,设,第二节 矩阵对策的最优纯策略,一、矩阵对策,二 、理智局中人的选择,在矩阵对策中,局中人将如何选取自己的策略呢?,三、最优纯策略与
3、鞍点,对策值的含义?,纯策略的含义?,定理1:,例1,例2,例3,第三节 矩阵对策的混合策略与混合扩充,一、基本概念,混合策略解的含义是什么?,使用期望收益法获得的混合策略的解表示: 多次重复决策时采用纯策略的频率 或者,单次决策时对纯策略的偏好即:期望收益不依赖对手的行为,6.混合扩充的解与值,分析*式:,例题,分析左式:,也可以写成:,进一步:,性质1:,二、性质,性质2:松紧定理,例4:猜手游戏,该对策问题无纯策略最优,在混合策略下求解:,解: 由性质1,可假设X,Y的所有分量均为非零,则左式等号成立,优势原则,例: 用优超原理求解下列对策,a3 a2,a4a1,2 3,4,5,a3 a5,解得:x=(0,0,1/3,2/3,0)y=(1/2,1/2,0,0,0) V=5,1,2,a3,a4,性质4:,性质5:,三、基本定理与LP解法,定理2:,证:,基本定理:G在混合扩充中一定有解。,LP解法:,基本定理的证明过程同时给出了矩阵对策的LP解法 。,例6:,先应用优超原理化简A,解法一:,解法二:22矩阵可以直接按公式计算:,作业,P475 15.13(2) 求解如下的混合策略决策问题,X=(10/12, 2/12) Y=(8/12, 4/12),