1、2019/6/12,金融,第二章 完全信息静态博弈,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。 “划横线法”是求解完全信息静态博弈的常用方法。 通常说来,完全信息静态博弈都存在“纳什均衡”或“混合策略纳什均衡”。,第一节 定义和求解方法,一、完全信息静态博弈的定义和实例 完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。 可以通过支付矩阵(Payoff Matrix)寻找完全信息静态博弈的均衡。 以“囚徒困境”为例,介绍支付矩阵的构造方法和应用。,1囚徒困境,在“囚徒困境”博弈中,有
2、两个博弈参与者:嫌疑人甲和嫌疑人乙。 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方 。 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。 嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。,“囚徒困境”博弈的支付矩阵,矩阵左上方的(5,5)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。,矩阵左下方的(10,1)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“坦白”时
3、,两名嫌疑人能够得到的收益。 矩阵右上方的(1,10)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。 矩阵右下方的(2,2)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。,2智猪博弈,猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。,如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。
4、小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是 4,小猪得到的收益是 2。,如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为 10。小猪徒劳无功
5、,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益 -2。 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益 0。,“智猪博弈”的支付矩阵,二、划横线法,1通过“划横线法”求解“囚徒困境”博弈的均衡,如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? 理性的嫌疑人甲会选择坦白。 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 类似可分析其他情况,2通过“划横线法”求解“智猪博弈”的均衡,如果大猪选择按开关,那么小猪应该如何选择? 理性的小猪会选择等待。 在小猪选择等待所对应的收益“2”的下方划一道短横线。 类似可分析其他情况,第二节 纳什均衡,一、纳什均
6、衡的定义给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”(Nash Equilibrium)。,“囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。 给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均衡的策略。 给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什均衡的策略。,“智猪博弈”的纳什均衡为:(大猪选择按开关,小猪选择等待)。 给定大猪在纳什均衡的策略选择:按开关;小猪的最优策略就是等待,小猪没有动机
7、改变策略。 给定小猪在纳什均衡的策略选择:等待;大猪的最优策略就是按开关,大猪没有动机改变策略。,二、存在多个纳什均衡的博弈,1性别博弈,采用“划横线法”寻找“性别博弈”的纳什均衡 (男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博弈”的纳什均衡。,甲、乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄的独木桥,两人都会掉到河里,均得到收益 -10。 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20,面子受损的甲 得到收益 -2。 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20,面子受损的乙得到收
8、益 -2。 如果甲和乙均选择退让,那么双方均得到收益 10。,2. “斗鸡博弈”,采用“划横线法”寻找“斗鸡博弈”的纳什均衡,(甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈”的纳什均衡。,假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”,另一个是企图进入市场的“潜在进入者”。 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个可以选择的策略:斗争、默许。 如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会使得双方均亏损,双方收益均为 -10。 如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可获得收益 5。 如果潜在进入者选择不进入,在位者选择斗争
9、,那么潜在进入者的收益为 0,在位者的收益为 20。 如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收益为 0,在位者的收益为 15,3“市场争夺战”博弈,采用“划横线法”寻找“市场争夺战”博弈的纳什均衡,(潜在进入者进入、在位者默许)和(潜在进入者不进入、在位者斗争)都是“市场争夺战”博弈的纳什均衡。,三、无法通过“划横线法”找到纳什均衡的博弈,1“锤头、剪刀、布”博弈,通过“划横线法”无法找到“锤头、剪刀、布”博弈的纳什均衡。,市场中有两个厂商进行产量竞争。 市场上该商品的总产量为:Q = q1 + q2 。 其中:Q 为总产量,q1 为厂商 1 的产量,q2 为厂商 2 的产
10、量。 市场的需求函数为:P = A - Q 。 其中,P 为市场价格,A 为外生常数。 厂商 1 的生产成本函数为:C(q1) = cq1。其中 c 为厂商 1 的边际成本,且假设厂商 1 的生产没有固定成本。 类似的,厂商 2 的生产成本函数为: C(q2) = cq2 。 厂商 1 和厂商 2 通过选择各自的最优产量达到各自利润最大化的目标。,2古诺寡头博弈,在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法通过“划横线法”求解古诺寡头博弈的均衡。 但可以通过求解两个厂商的“反应函数(Reaction function)”来求解寡头博弈的均衡。 厂商 1 在决策时,假设厂商 2
11、的产量为给定 厂商 2 在决策时,假设厂商 1 的产量为给定根据 ,得到得到反应函数(Reaction Function),古诺寡头博弈反应函数和均衡,市场中有 n 个厂商进行产量竞争。 市场上该商品的总产量为:Q = q1 + q2 + + qn 。 其中:Q 为总产量,qi 为厂商 i 的产量。 市场的需求函数为:P = A - Q 。 其中,P 为市场价格,A 为外生常数。 厂商 i 的生产成本函数为:C(qi) = cqi。其中 c 为厂商 i 的边际成本,且假设厂商 i 的生产没有固定成本。 市场中 n 个厂商 通过选择各自的最优产量达到各自利润最大化的目标。,3多厂商古诺寡头博弈,
12、市场中的 n 个厂商利润最大化,一阶条件得到:均衡产量为:均衡价格为:,可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边际成本 c,即:也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋于无穷时,市场的均衡价格趋于完全竞争市场下的价格。,4伯特兰德寡头博弈,市场中有两个厂商进行价格竞争。 厂商 1 的价格为 p1 。 厂商 2 的价格为 p2 。 厂商 1 的生产成本函数为:C(q1) = cq1。其中 c 为厂商 1 的边际成本,且假设厂商 1 的生产没有固定成本。 类似的,厂商 2 的生产成本函数为: C(q2) = cq2 。 厂商 1 和厂商 2 通过选择各自的最优价格达到各
13、自利润最大化的目标。,当厂商 1 产品的价格大于厂商 2 产品的价格时,消费者会购买厂商 2 的产品,对厂商 1 产品的消费量为零。 当厂商 1 产品的价格小于厂商 2 产品的价格时,消费者会购买厂商 1 的产品,对厂商 2 产品的消费量为零。 当厂商 1 产品的价格等于厂商 2 产品的价格时,消费者会同时消费厂商 1 和厂商 2 的产品。 因此伯特兰德寡头博弈的均衡为:,伯特兰德寡头博弈的均衡是一个纳什均衡。 这是因为:当厂商 2 的价格满足 时, 厂商1的最优策略选择是使得自己的定价满足 如果厂商 1 的定价高于 c ,则厂商 1 会失去整个市场; 如果厂商 1 的定价低于 c ,则厂商
14、1 会亏损。 因此当厂商 2 的定价等于 c 时,厂商 1 的最优定价策略是使得价格等于 c。 类似的,当厂商 1 的价格等于 c 时,厂商 2 的最优定价策略也是使得价格等于 c。,现实中的囚徒困境,1囚徒困境与苏美争霸,在苏美争霸博弈中,美国和前苏联都处于“囚徒困境”中。,苏美争霸博弈的支付矩阵,2囚徒困境与观看演出,不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷入“囚徒困境”中。,众人观看演出博弈的支付矩阵,3囚徒困境与交通秩序,博弈均衡是一个“囚徒困境”。 博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不能提高交通参与者的出行效率,反而会使所有人的出行时间延长
15、。,交通秩序博弈的支付矩阵,“囚徒困境”的内在根源是:人类的个人理性有时可能导致集体的非理性 在“囚徒困境”中,每个博弈参与者都是理性人。 博弈参与者的个体理性表现为:每个博弈参与者都只关心自己的利益,不关心博弈对方的利益及整体利益。 然而,个体理性自由发挥的结果,导致了集体不理性。,第三节 混合策略均衡,一、混合策略纳什均衡的定义和求解方法混合策略均衡指博弈参与者以一定的概率分布随机选择策略集中的策略,使得其他博弈参与者在各个可能的策略之间无差异。,在“锤头、剪刀、布”的博弈中 博弈参与者 1 的混合策略指:博弈参与者 1 在“锤头、剪刀、布”三个策略中随机选择,使得博弈参与者 2 在“锤头
16、、剪刀、布”三个策略之间无差异。 博弈参与者 2 的混合策略指:博弈参与者 2 在“锤头、剪刀、布”三个策略中随机选择,使得博弈参与者 1 在“锤头、剪刀、布”三个策略之间无差异。 假设博弈参与者 1 选择出“锤头”的概率为 ,选择出“剪刀”的概率为 ,选择出“布”的概率为,得到联立方程组:类似的,得到联立方程组:得到,二、“小偷和守卫”博弈,“小偷和守卫”博弈是一个存在混合策略纳什均衡的经典博弈。 守卫负责在夜间看守一个仓库,小偷试图在夜间去偷窃这个仓库的物品。 守卫有两个策略:睡觉、不睡觉。 小偷也有两个策略:偷、不偷。,根据“划横线法”,“小偷和守卫”博弈没有纯策略均衡(Pure Str
17、ategy Equilibrium),但“小偷和守卫”博弈存在一个混合策略纳什均衡。 假设守卫选择“睡觉”的概率为 ,选择“不睡觉”的概率为 得到:求解联立方程组,得到:,假设小偷选择“偷”的概率为 ,选择“不偷”的概率为 小偷通过选择自己的策略使得守卫在选择“睡觉”和“不睡觉”两种策略之间无差异。 得到:求解联立方程组,得到:,第四节 占优策略与均衡,一、严格占优策略的定义博弈参与者进行策略选择时,有可能存在某个策略的收益严格优于其他策略的情况,该策略被称为严格占优策略(Strictly Dominant Strategy)。,“囚徒困境”博弈与严格占优策略不管嫌疑人乙选择何种策略(坦白还是
18、不坦白),嫌疑人甲的最优策略都是坦白。在这种情况下,“坦白”是嫌疑人甲的严格占优策略。 不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最优策略都是坦白。因此“坦白”也是嫌疑人乙的严格占优策略。,二、通过寻找严格占优策略求解博弈均衡,在寻找博弈均衡时,如果该博弈某参与者存在严格占优策略,那么在博弈均衡中,该参与者会选择严格占优策略,而不会选择其他策略。 因为不管其他参与者选择何种策略,该参与者选择严格占优策略的收益均高于选择其他策略的收益。 因此在博弈均衡中,理性参与者一定会选择严格占优策略。,1“囚徒困境”博弈,由于“坦白”是嫌疑人甲的严格占优策略,所以将嫌疑人甲选择“坦白”策略导致的
19、博弈结果从博弈支付矩阵中剥离出来。将嫌疑人乙选择“坦白”策略导致的博弈结果从上表中剥离出来,定理:如果每个博弈参与者都存在一个严格占优策略,那么在博弈中各参与者必然选择其严格占优策略。各博弈参与者的严格占优策略构成博弈均衡。,在某些博弈中,并不是所有博弈参与者都存在严格占优策略。 2.“智猪博弈”小猪存在严格占优策略,大猪没有严格占优策略。 将小猪选择严格占优策略“等待”导致的博弈结果从上表中剥离出来,得到:给定小猪必然选择“等待”,大猪如果选择“按开关”,大猪得到的收益为 4,如果选择“等待”,大猪得到的收益为 0。因此大猪会选择“按开关”。 所以“智猪博弈”的均衡解为(大猪选择按开关,小猪
20、选择等待)。,在某些博弈中,所有博弈参与者均不存在严格占优策略。 3性别博弈对男方而言,如果女方选择看足球,那么男方会选择看足球;如果女方选择听昆曲,那么男方会选择听昆曲。男方不存在严格占优策略。 对女方而言,如果男方选择看足球,那么女方会选择看足球;如果男方选择听昆曲,那么女方会选择听昆曲。女方也不存在严格占优策略。 无法通过寻找严格最优策略法求解“性别博弈”的均衡解。,三、严格被占优策略,有些博弈不存在严格占优策略,但存在严格被占优策略(Strictly Dominated Strategy)。 通过剔除严格被占优策略的方法也可以找出博弈的均衡。 1严格被占优策略的定义严格被占优的策略指:
21、不管其他博弈参与者采用何种策略,某个博弈参与者采用某种策略的收益总是小于采用另外某种策略的收益。收益较小的策略称为该博弈参与者的严格被占优策略。,存在严格被占优策略的博弈博弈参与者 1 和博弈参与者 2 都没有严格占优策略。 无法通过寻找严格占优策略法求解此博弈的均衡。 策略c是博弈参与者 2 的严格被占优策略。 不管博弈参与者 1 采用何种策略,博弈参与者 2 选择策略 c 的收益均小于选择策略 b 的收益。,2剔除严格被占优策略与博弈均衡,将博弈参与者 2 的严格被占优策略从博弈支付矩阵中剔除,得到:策略 A 成为博弈参与者 1 的严格占优策略。 将参与者 1 选择策略 A 导致的博弈结果
22、从表中剥离出来,得到:,当博弈参与者 1 选择策略 A 时,博弈参与者 2 的最优策略选择是策略 b。 博弈均衡为:(参与者1选择策略A,参与者2选择策略b),练习:通过剔除严格被占优策略法找到下表的博弈均衡博弈的均衡解为:博弈参与者 1 选择策略 C,博弈参与者 2 选择策略 c。,四、弱占优策略与弱被占优策略,有些博弈不存在严格占优策略,但存在弱占优策略。有些博弈不存在严格被占优策略,但存在弱被占优策略。 1弱占优策略与弱被占优策略的定义 弱占优策略(Dominant Strategy)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略得到的收益总是大于或等于采用另外某种策略的收
23、益。收益较大的策略称为该博弈参与者的弱占优策略。 弱被占优策略(Dominated Strategy)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略的收益总是小于或等于采用另外某种策略的收益。收益较小的策略称为该博弈参与者的弱被占优策略。,严格占优策略指博弈参与者选择某个策略的收益严格大于另外某个策略的收益。 弱占优策略指博弈参与者选择某个策略的收益大于等于另外某个策略的收益。 严格被占优策略指博弈参与者选择某个策略的收益严格小于另外某个策略的收益。 弱被占优策略指博弈参与者选择某个策略的收益小于等于另外某个策略的收益。,2弱占优策略与弱被占优策略的应用与局限,在下表中,策略 C
24、 是博弈参与者 1 的弱被占优策略,策略 C 被策略 A 弱占优,也被策略 B 弱占优。面对同样的博弈支付矩阵,通过剔除弱被占优策略的方法求解时,剔除策略的顺序不同,得到的均衡解也可能不同。 因此不建议采用剔除弱被占优策略的方法寻找博弈均衡。,第五节 补充阅读,一、博弈的数学定义 二、纳什均衡的数学定义和存在性 三、严格占优策略的数学定义 四、混合策略的数学定义,在完全信息静态博弈中,博弈各方同时行动且博弈各方对博弈信息均完全了解。 某些完全信息静态博弈可以通过“划横线法”求解出均衡。 在纳什均衡中,给定其他参与者选择的策略,任何一方博弈参与者都没有动机改变自己的策略选择。 寻找严格占优策略或
25、剔除严格被占优策略也是求解博弈均衡的有力工具。 在混合策略纳什均衡中,博弈参与者以一定的概率分布随机选择策略集中的策略,使博弈其他参与者在选择各个可能的策略时无差异。,本章小结,2019/6/12,金融,本章习题,1什么是完全信息静态博弈? 2什么是“智猪博弈”?请举出一个现实生活中满足“智猪博弈”模式的实例。 3什么是纳什均衡?用“划横线法”分别求解下表所示博弈的纳什均衡。,2019/6/12,金融,4什么是“囚徒困境”?“囚徒困境”的纳什均衡是什么? 5什么是混合策略纳什均衡?试求解表2-35所示“手心手背”博弈的混合策略纳什均衡。6什么是严格占优策略?什么是严格被占优策略?什么是弱占优策略?什么是弱被占优策略?试通过寻找严格占优策略法求解“囚徒困境”博弈和“智猪博弈”的博弈均衡。,