收藏 分享(赏)

4. 完全信息动态博弈.pdf

上传人:精品资料 文档编号:11125762 上传时间:2020-02-08 格式:PDF 页数:93 大小:7.36MB
下载 相关 举报
4. 完全信息动态博弈.pdf_第1页
第1页 / 共93页
4. 完全信息动态博弈.pdf_第2页
第2页 / 共93页
4. 完全信息动态博弈.pdf_第3页
第3页 / 共93页
4. 完全信息动态博弈.pdf_第4页
第4页 / 共93页
4. 完全信息动态博弈.pdf_第5页
第5页 / 共93页
点击查看更多>>
资源描述

1、博弈论 杜 少 甫 学术型硕士研究生课程2 中国科学技术大学管理学院 2013 第2 章 完全信息动态 博 弈 完全信息静态博弈 vs 完全信息动态博弈 信息:complete 局中人、策略集、支付函数均 为共同 知识 出手顺序: 静态:同时出手,或不清楚先 后顺序 动态:先后出手3 中国科学技术大学管理学院 2013 博 弈的扩展 式表述 策略式表述(Strategic Form) 用三 元组来描 述博弈 没 有 显式反映 出手时 间(隐含 在策略 集中) ,更适用 于静态 博弈。 扩展式表述(Extensive Form) 将 历 史集、信 息集等 引入,更 适用于 动态博 弈 常 用

2、树状图几 何表示 博弈树(Game Tree) 局中人出手的顺序 局中人的行动空间(action set) 局中人出手时所拥有的信息4 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:田忌赛马 典型的动态博弈 隐含假设:齐威王先出手,田忌观察后出手。 注:由于前两次选定后,第三次就已确定,相当于分别两次出手。 零和博弈 支付可用田忌的净胜局数表示。 齐 田 齐 田 1 2 3 1 2 3 2 3 3 2 3 1 1 2 3 1 2 3 1 3 1 2 3 2 1 3 2 3 2 3 3 1 1 1 3 1 1 1 2 1 1 1 1 1 1 1 1 1 1 3 1 3

3、 1 2 1 2 2 1 3 2 3 2 3 1 3 1 2 1 2 1 3 2 3 2 3 1 3 1 2 1 2 15 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:房地产开发博弈 局中人:两开发商A 、B 市场需求可能为“ 高” ,也可能为“ 低” 若无人开发,谁也不知道市场需 求具体 是什 么 若有人开发,后面的人可能会观 察到市 场需 求 当局中人对博弈局势中某事件/状态不被完全了解时 凭借经验、通过调研等方式去“ 猜” 在一定程度上,“ 听 天 由命” 、“ 顺其 自然” 、“ 如有 神 助” 当人对某事件/状态完全无法判 断时 ,往往 采取等 概率 处

4、理 虚拟局中人(quasi-player)“自然(nature, NA)” or “ 神(god)” 假设高、低需求的自然概率分别 为1/2 牛顿晚年:“ 宇宙第一原动力” ,“ 引 力解 释了行 星的运 动, 但却不 能解释 谁让 行星 运动起来的。上帝统治万物,知 晓所有 做过 和能做 的事。”4, 4 8, 0 0,8 0, 0 高需求情形3, 3 1, 0 0,1 0, 0 低需求情形6 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 行动顺序: 开发商A先行动:“ 开发D” 与“ 不开 发U” ; 自然选择市场需求:“ 高H” 与“ 低L” ; 开发商B观测到A

5、的行动及市场需求情况 ,再行 动。 H L D U D U D U (4, 4) (8, 0) ( 3, 3) (1, 0) H L D U D U (0,8) (0, 0) (0, 0) (0,1) A B B B B Na Na 不同行动路 径对应不同 支付向量7 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树构成 结点(node) : 决策结点(decision node) 局中人采取行动的时点 初始结点(initial node) 为树根; 终端结点(terminal node) 博弈行动路径的终点 标注支付向量。 枝(branch) : 每一枝代表局中人

6、在出手时点 的可选 行动。8 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树构成(续) 信息集(information set): 对于某一特定的局中人而言, 所谓 信息 集 就 是能够回 答以下 问题的 某种集合,即: In game theory, an information set is a set that, for a particular player, establishes all the possible moves that could have taken place in the game so far, given what that

7、player has observed so far 当博弈进行到某个阶段的时候,根据已观察到的 情况,局中人所了解的博弈已发生的所有可能行动9 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树的结点 X: 博 弈树所有结 点的集合 。 : 定义于X 上的二元优 先关系(precedence relation) x 1 ,x 2 X , x 1 x 2 表示“结点x 1 处在x 2 之前”,此关系满足 非自反性(irreflexivity) : x X , x x 不 成立 传递性(transitive) : x 1 ,x 2 ,x 3 X , 若x 1 x 2 ,

8、 x 2 x 3 ,则x 1 x 3 不对称性(asymmetric) : x 1 ,x 2 X, 若x 1 x 2 , 则x 2 x 1 不成立 注:反对称性(antisymmetry) vs 不对称性 是严格偏序关系(strict partial order) 注:并非X内任意 两结点间 均是可 比较的 不同行动路径上的结点不可比较 。 if a b and b a then a = b10 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树的结点 前趋(predecessor) : 对于x X , x X满足x x,称x 是x的一个前 趋 前趋集:P(x)=x|

9、 x x, x X P(x)= x为 初始结点 直接前趋(immediate predecessor):某结点 直接相 连的前趋 结点 x X , 若存 在一个x* P(x) ,对于 x P(x), xx*,均有 x x* , 则称x* 为x 的 直接 前趋。 直接前趋 记为p(x)11 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树的结点 后继(successor) : 对于x X , x X 满足x x,称x 是x的一个 后继 后继集:T(x)=x| x x, x X T(x)= x为 终点结点 直接后继(immediate successor):某结点 直接

10、相 连的后继 结点 x X ,若 存在x* T(x) ,使 得p( x*)= x ,则称x* 为x 的 直接后继 。 一 个 结点的后 继结点 可有多个 ,x的所有 直接后继 的集合 记为t(x)12 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树的结点 初 始 结点未 必唯一 ,但可 转换成 一个等 价的单 初始结 点博弈 树。 方 法 :引入 虚拟局 中人“ 自然Na” 例: A B B A B B Na A B B A B B 可以假定博 弈 树初始结点 唯 一13 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 博弈树性质 有向图(D

11、igraph):任一枝均是个有向边,自上而下 不允许有闭环(传递性不对称性) 所有非初始结点的入度(InDegree) 为1,出度(OutDegree) 为可选择的行动数。 入度直接前趋数 非初始结点的直接前趋唯一 出度直接后继数 非初始结点x入度为1 前趋集P(x) 是 全序集(totally-ordered set) x 1 ,x 2 P(x) ,则x 1 x 2 和x 2 x 1 有 且只有 一个成 立。 前趋集P(x) 构成一 条链(Chain) 14 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 行动顺序的表述 在 决 策结点中 标注局 中人(包 括“ 自然”

12、 ) 可记局中人集合为N=1,n;自然为0,用N +0 = 0,1,n表示包括虚拟局 中人在内的所有局中人。 函数表述 i: X N +0 i(x)即为在决策结点x处出手的局中人 以下图博弈树为例: x 0 x 11 x 12 0 1 1 2 2 2 2 x 21 x 22 x 23 x 24 0 11 12 21 22 23 24 ( ) 0; ( ) ( ) 1 ()()()() 2 ix ix ix ix ix ix ix = = = = = = =15 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 支付函数的表述 博弈树的每个终端结点z唯一决定了某条博弈路径 关

13、 系是严格 偏 序的( 传递性 、不对 称性) 任 何 结点的 前趋集 是全 序的 可用终端 结 点z 来表示z 对应的博弈路径 U(z)=(u 1 (z), u n (z):博弈路 径z 所导致的支付向量。16 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 信息集(Information Set) 对于某一特定的局中人而言,所谓信息集就是能够回答 以下问题的某种集合 当博弈进行到某个阶段的时候 ,根据 已观察 到的情况 ,局中 人 所了解的博弈可能已发生的所 有可能 行动 在扩展式表述中,通常信息集被定义为局中人出手时的 结点集合,因为这样的结点集合可回答上述问题17

14、 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:房产开发动态博弈 H L D U D U D U (4, 4) (8, 0) ( 3, 3) (1, 0) H L D U D U (0,8) (0, 0) (0, 0) (0,1) A B B B B Na Na 31 x 32 x 33 x 34 x Left Right 1. 若在局中人B 出 手的 时候, 他清楚 地知 道在此 之前局 中人A 和 虚拟 局中人 “自然 ” 的行动,那么 他就能 准确地知道自己处在博弈树第三层(阶段)的 哪个决 策结 点 上此次出手时, 局中人B有四 个信息 集, 每个信 息集中

15、 只有 一个决 策结点 ; 2. 若局中人B出手 的时 候,他 知道局 中人A 的 行动 但不知 道“自 然选 择”, 那么他 能 够知道自己当 前是处 在博弈树的Left(x 31 和x 32 )还是Right(x 33 和x 34 ),但却分不清 “x 31 与x 32 ”或“x 33 与x 34 ”。 这些无 法被局 中人B 区 分的结 点放在 一起 构成一 个信息 集,即此时局 中人B的信息 集有两 个:x 31 , x 32 和x 33 , x 34 18 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 信息集(Information Set) 信息集是决策结点

16、(状态)的集合 集合中的每个结点对应于某一 局中人 当局中人达到信息集时,局中 人无法 对信息 集中结点 加以区 别 局中人只知道博弈是否到达信 息集中 某决策 结点( 状态) , 但却并不 确知究竟哪一个。 当信息集中有多个结点时,局 中人无 法判断 当前到达 信息集 中具体 哪个结点(状态) 信息集反映了局中人每次出手时对已 发生的情况所掌握的程度19 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 信息集(Information Set) 完美信息(perfect information) : 在某时点局中人能确定处于某 一结点( 状态) 信息集只包含一个结点 单结

17、点信 息集 不完美信息(imperfect information) : 局中人不能准确判断之前所发 生的事 ,故不 了解当前 在博弈 树中的 精确位置(状态) 。 信息集包含多个结点多 结点信息 集20 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:性别战博弈 假设男方先出手 完美信息: 女方出手时确知男方已采取的 行动 男方信息集:Nd 0 女方信息集:Nd 1 和Nd 2 1, 2 0, 0 0, 0 2, 1 女 Football Opera 男 F O F O F O F O (2,1) (0, 0) (0, 0) (2,1) 0 Nd 1 Nd 2 Nd

18、 男 女 女 完美信息21 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:性别战博弈 不完美信息:女方出手时不知道男方已采取的行动 男方信息集:Nd 0 女方信息集:Nd 1 , Nd 2 习惯在博弈树上用虚线将同一信息集下的结点相连 F O F O F O (2,1) (0, 0) (0, 0) (2,1) 0 Nd 1 Nd 2 Nd 男 女 女 不完美信息 在本例中,此不完美信 息动态博弈事实上就是 一个静态博弈22 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 例:房地产开发博弈 H L D U D U D U (4, 4) (8,

19、0) ( 3, 3) (1, 0) H L D U D U (0,8) (0, 0) (0, 0) (0,1) 0 Nd 11 Nd 12 Nd 21 Nd 22 Nd 23 Nd 24 Nd A Na B B B B Na H L D U D U D U (4, 4) (8, 0) ( 3, 3) (1, 0) H L D U D U (0,8) (0, 0) (0, 0) (0,1) 0 Nd 11 Nd 12 Nd 21 Nd 22 Nd 23 Nd 24 Nd A Na B B B B Na 若开发商B出手时 确知A的行动,但不知道自然选择(即市场需求情况) B的信息集:Nd 21 ,

20、 Nd 22 和Nd 23 , Nd 24 确知自然选择,不了解A的行动 B的信息集:Nd 21 , Nd 23 和Nd 22 , Nd 24 23 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 信息集 H: 信息集的集 合 h: 某 一特定 信息集 h H 。h(x) :含 有决策 结点x的信息 集 若两结点x, x同 属 一个信 息集, 即 x, x h x h(x), x h(x),则 xP(x) , xT(x) ; x P(x) , x T(x) 同 一 信 息 集 内的决 策结点 不互为 前趋、 后继 i(x)=i(x) 同一信息集内 的 决策 结 点同 属

21、一个 局 中人 记A(.) 为 决策结的 行动空间,A(x)=A(x) 同一信息集内 的 决策 结 点的 行 动空 间 一致 可通过前面例 子 验证 故只需针对信 息 集定 义 行动 空 间, 可 引入A(h) 表 示 信息集h 的行动 空间。24 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 信息集 自然选择是随机的(可能服从某种概率分布) 完美信息博弈 形 式 不完美信息博 弈 形式 H L D U D U D U (4, 4) (8, 0) ( 3, 3) (1, 0) H L D U D U (0,8) (0, 0) (0, 0) (0,1) A B B B B

22、 Na Na H L D U D U D U (4, 4) (8, 0) ( 3, 3) (1, 0) D U D U (0,8) (0, 0) (0, 0) (0,1) A B B B B Na A D U 虚拟局中人 “ 自然”的信 息 集总可认为 是 单结点的 自 然 在局中人 后行动 自 然 在局中 人前行 动,但未 被观察 到 注:同一博弈可通过不同博弈树表述25 中国科学技术大学管理学院 2013 博弈的扩展式 表述(Cont.) 静态博弈的扩展式表述 局 中 人同时出 手 博 弈 树可从任 何一个 局中人的 决策结 点开始 局 中 人出手时 互不了 解行动选 择 每 个 局中人只

23、有 一个信 息集 例 : 囚徒困境 招 供 沉默 招 供 沉 默 招 供 沉 默 ( 5, 5) ( 8, 0) (0, 8) ( 1, 1) B A A ( 5, 5) (0, 8) ( 8, 0) ( 1, 1) 招供 沉默 招供 沉默 招供 沉 默 A B B26 中国科学技术大学管理学院 2013 完美记忆(Perfect Recall) 完美记忆:每个局中人均不会 忘记 以前 已获 取的任何 信息 。 每个局中人能牢记自己先前 已采取过的行动 ; 每个局中人能牢记自己先前 已掌握的事情 。 Perfect recall refers to the assumption that, a

24、t every opportunity to act, each Player remembers what he did in prior moves, and each player remembers everything that he knew before. Effectively, the assumption is one that players never forget information once it is acquired (http:/) 完美信息:每个局中人在任一 行动时 点均了 解博弈所 有以往 的历史 博弈树中每个结点都是一个信息集 不会出现多个局中人同时

25、出手的情况 注:若博弈中出现多个局中人同 时出手 情形 ,事实 上可转 换为 不完美 信息博 弈。 完美信息必然完美记忆,完美记忆未必完美信息27 中国科学技术大学管理学院 2013 关 于完美记 忆的例子 U B A A A A B A D L R L R 不完美记忆 A 第 二次出手时 忘记了 自己第 一次出 手采取 的行动 U B A A A A B A D L R L R 完美记忆但不 完 美信 息 A 第 二次出手时 仍记得 以前的 出手, 但不了 解B 所采取的 行动 U B A A A A B A D L R L R B B B B B B B B 不完美记忆 B 在 第 一次出

26、 手时知 道A 第 一次出 手时的 选择; 但在第二 次出手 时 却把这一 信息忘 记 了 在下围棋或打牌时,参与者 经常会忘记以前的行动28 中国科学技术大学管理学院 2013 扩展式博弈的Nash均衡 例:质量选择博弈(Turocy & vonStengel, 2001) 局中人A:服务供应商;局中人B:服务消费者 局中人A先出手,选择提供 高/ 低 质量的 服务 局中人B根据局中人A的选择,决定 买 或 不买 双方策略集: S A 高,低 ; S B (买,买) ,(买, 不买) ,(不买,买) ,(不买 ,不买) 先出手者不了解后出手者选择 策略行动 在完美信息动态博弈中,后出手 者了

27、解 先出 手者选 择 策略行动 后出手者的策略:针对先出手者 的不同 行动 均有相 应的应 对行 动 (1, 0) (2, 0.5) (0, 0) (1.5,2) 不买 低 高 A B B 不买 买 买 策略(x,y ) s A =高? x : y29 中国科学技术大学管理学院 2013 扩展式博弈的Nash均衡 例:质量选择博弈(Turocy & vonStengel, 2001) 用策略式博弈的双矩阵表述 (1, 0) (2, 0.5) (0, 0) (1.5,2) 不 买 低 高 A B B 不买 买 买 (买,买) (买,不买) ( 不买,买) ( 不买,不买) 高 1.5, 2 1.

28、5, 2 0, 0 0, 0 低 2, -0.5 1, 0 2, -0.5 1, 0 Nash均衡 1. 策略组合:( 高, ( 买, 不买) 和 ( 低, (不买, 不买) 2. 行动组合: ( 高, 买) 、 ( 低, 不买) 可见:策略 式 博弈的分析 方 法同样适用 于 动态博弈30 中国科学技术大学管理学院 2013 扩展式博弈的Nash均衡 逆向归纳法(Backward Induction) 又称“Kuhn 方法” 适 用 对象: 完全 且 完美 信息动 态博弈 Perfect : 后出手者了解历史 最后出手者无后续阶段牵制,能够作出准确的选择; Complete : 所有局中人的

29、策略、支付为共同知识 先出手者虽然不知道后出手者的具体行动,但却知道后出手者对己方行动 的反应,及其所带来的支付31 中国科学技术大学管理学院 2013 扩展式博弈的Nash均衡 逆向归纳法(Backward Induction) 从 树 叶向树根 方向逆 推: 枝加粗:由粗树枝形成的行动路径为均衡路径 剪枝:完整的行动路径为均衡路径 (1, 0) (2, 0.5) (0, 0) (1.5,2) 不买 低 高 A B B 不 买 买 买 (1, 0) (2, 0.5) (0, 0) (1.5,2) 不买 低 高 A B B 不 买 买 买 博弈Nash均衡(用行动组合表示):(高,买) 思 考

30、:为 什么 用策 略式博 弈的 双矩 阵划线 法与 用扩 展式博 弈的 逆向 归 纳 法得出 的结 果有 所不同 ?32 中国科学技术大学管理学院 2013 扩展式博弈的Nash均衡 原因在于: 在静态博弈中,双矩阵能够反映策略式博弈的全部信息(局中人、策略、支付) ; 而在动态博弈中,双矩阵 丢失了部分博弈信息(策略部分) 双矩阵中所列的“ 策略” 虽 能够反映后出手者对先出手者的应对方案;却 丢 失了各方出手顺序的信息,即:没反映出“ 后出手者能够观察到先出手者的 行动,并将应对方案付诸实施” 双矩阵中,型如(买,不买)这样的动态策略被静态化了。 NE( 逆向归纳法) NE( 划线法) “

31、 扩展式表述 策略式表述” 并不意味着“ 博弈树 双矩阵”33 中国科学技术大学管理学院 2013 扩 展式博弈 中的策略 参数符号 H i :局中人i的信息集集合;h i H i 为某一信息集; A i :局中人i的所有可选行动集合; 局中人i的每一个纯策略都是从信息集到行动集的映射 反映了处于某信息集 的局中人如何行动 局中人i的纯策略空间: () ii ii hH A Ah : ii i sH A () ii ii hH S Ah = (1, 0) (2, 0.5) (0, 0) (1.5,2) 不 买 低 高 A B B 不买 买 买12 () () () ( ),( ),( ),(

32、) Aa Bb b S Ah S Ah Ah = = = = = 低 , 高 不 买 , 买 不 买 , 买 不 买, 不 买 不 买, 买 买, 不 买 买, 买 局中人i在信息集h i 下的可选行动集34 中国科学技术大学管理学院 2013 行为策略 Behavioral Strategy 前文提到,同一信息集内决策 结点的 行动空 间一致, 故只需 考虑每个 信息 集所对应的行动空间即可 行为策略(Behavioral Strategy) 局中人对自己的每个信息集所对应的所有可能行动所赋予的某一 概率分布,且不 同信息集下相互独立 A behavioral strategy assign

33、s to each information set of a player a probability distribution over the actions available at this information set 假设局中人i 有k个信息集,信息集的集合为 其任一信息集h ij 对应的行动空间就 为A(h ij ),假 设 局中人在此行动空间上设定一个 概率分 布b ij ,反 映出他 在此信 息集 下的行 动态度 则局中人i的某一行为策略可表 示为 1 , i i ik Hh h = 1 1 (, ) | 0 , 1 , , 1 L Ll l ij ij ij ij ij

34、l b p pp l L p = = = 1 (), L ij ij ij Ah a a = 1 (,) i i ik bb b = 35 中国科学技术大学管理学院 2013 行为策略 Behavioral Strategy 动态博弈的行为策略的内涵类 似于静 态博弈 的混合策 略 右图描述了局中人A 和B的一种行为 策略 局中人A有一个信息集,行为策略(0.3, 0.7) 局中人B有两个信息集,行为策略 定理4.1 (Kuhn, 1953):在 完美记 忆博弈 中,行为 策略等 价于混合 策略。 关于Kuhn定理和行为策略,见附录 4.1 本课程只简单介绍行为策略概 念,围 绕着行 为策略的

35、 更深入 讨论略。 (1, 0) (2, 0.5) (0, 0) (1.5,2) 不 买 低 高 A B B 不 买 买 买 0.3 0.7 0.5 0.5 0.6 0.4 ( ) (0.5,0.5),(0.6,0.4)36 中国科学技术大学管理学院 2013 扩 展式博弈 的简化策 略式 例图博弈 局中人A第一次出手为U时,博弈结束 出手为D时,马上又与局中人B展开一个静态博弈 U A A B A D L R u d u d 为方便起见,可用局中人的各次行 动构成的向量来描述纯策略 A有四个纯策略 (U,u),(U,d),(D,u),(D,d)37 中国科学技术大学管理学院 2013 扩 展

36、式博弈 的简化策 略式 定义:两个纯策略是等价的,若 它们在 其他 局中人 所有纯 策略 下 都能产生相同的结果(结果分布) 。 显 然 ,若局中 人A第一次出 手选择 了U,那 么他的 第二阶段 信息集 是 不 可 达的,因 而(U,u) 和(U,d) 是等价的 扩展式博弈的简化策略式就是将 等价纯 策略 合并( 只保留 一个 而 舍弃其他)而得到的。 简 化 后,局中 人A 的(U,u) 和(U,d) 可 合并为(U,u) 或(U,d) 或直接 用U A只 有 三个纯策略U,(D,u),(D,d)38 中国科学技术大学管理学院 2013 承 诺与威胁 动态博弈中先出手局中人是否应 该相信

37、后出 手局中 人的某 种行 动 选择? 可信性问题 承诺(Promise):若后 出手局 中人选择 的某一 行动对 先出手局 中人是 有利的 ,则此 行动选 择对先出 手局中 人来说 是一种“承诺” ; 威胁(Threat):若 不利的 ,则“威胁” 定义: 某 一 局中人发 出一个 威胁( 承诺) ,若执行 此威胁( 承诺) 所对应的 支付 水 平 比不执行 更小, 则称为不 可置信(incredible)的威胁( 承诺) 威胁与承诺是博弈论中的一个重 要议题 威 胁 与承诺的 可信性( 有效性) 往往 会带来 不同的博 弈结果39 中国科学技术大学管理学院 2013 承 诺与威胁 例:哥哥

38、常抢弟弟的玩具,弟弟 则常向 父亲 告状。 父亲烦 了, 订下规矩 “ 别 烦我;无 论谁烦 我,你们 俩零花 钱全扣” 扣零花钱显然比没玩具玩更令人 郁闷 哥哥的策略集抢,不抢,弟弟的策 略集不 告发 ,告发 某 次 ,哥哥准 备抢弟 弟的玩具 ,弟弟 以“ 告发” 相威 胁。 哥 哥 想:虽然 告发让 我损失惨 重,但 你自己 不但没便 宜占, 还要蒙 受损失。 威胁不可 信 对威胁 不予理会 理性的弟 弟不会 告发。40 中国科学技术大学管理学院 2013 例:Selten(1965) 中 的一个 两人动态 博弈 双矩阵描述的策略式比博弈树 描述的 扩展式 多出一个NE ,但Selten

39、 认为 均衡(U, R)是不可信的(incredible) 。 均衡(U, R)依赖于“ 局中人2采取R行动” 局中人2的威胁 而此威胁是无效的。 局中人2并非愿意真采取此行动 (2, 2) (0, 0) (3,1) U 1 2 D L R L R U (2, 2) (2, 2) D (3, 1) (0, 0) 双矩阵 (2, 2) (0, 0) (3,1) U 1 2 D L R 2 L R (2, 2) (2, 2) (0, 0) (3,1) U 1 2 D L R41 中国科学技术大学管理学院 2013 例:市场进入壁垒博弈 静态博弈 按 照 现实逻辑 ,此博 弈显然应 有个出 手顺序

40、欲进入者(局中人1)先决定进入与否 原垄断者(局中人2)再决定是否阻挠 原 垄 断者的阻 挠威胁 是无效的 均衡为( 进入 ,默许) 100, 80 400, 0 0, -20 400, 0 进入 退却 默许 阻挠 (0,400) ( 20,0) (80,100) 退 1 2 进 许 阻42 中国科学技术大学管理学院 2013 例:借贷博弈 局中人2向局中人1私下借钱 无借条、不受法律约束 局中人2是无赖 不担心声望损失 局中人2承诺“ 还” 是“ 不可置信” 的 均衡为(不借,不还) (0, 0) ( 5,35) (10,20) 不 借 1 2 借 还 不 还43 中国科学技术大学管理学院

41、2013 可信威胁的例子 自断归路:两国均想占据某小岛,都有桥梁与之相连。 某国登岛,拆断与本国相连的桥梁 没有退路 缩小行 动空间,反而使己方有利 破釜沉舟;置于死地而后生48 中国科学技术大学管理学院 2013 适度原则 局 中 人发出承 诺或威 胁要适度 ,不应 超出一 定范围 如: 台湾宣布独立或发生重大动乱,大陆将出兵 可信, 反国家分裂法 日本首相参拜靖国神社,中国就向日本宣战 不可信 在理性假设下 不 可 信承诺/ 威胁是不 会发生 的行动 , 将 被 剔除; 剩 下 的行动是 可信的 、会发生 的。 可 信 行动组合( 行动路径) 动 态博弈 的均衡路 径52 中国科学技术大学

42、管理学院 2013 连 续行动集 的逆向归 纳法 前面提到的逆向归纳法针对博弈 树(有 限动 态博弈) 对于行动集连续情况,逆向归纳 法同样 适用 例 : 双寡头投 资博弈 两企业投资前单位生产成本为2;企业1可投资f装备一种新技术,使得单位 生产成本为0。 企业1先出手决定是否投资 企业2观察到企业1的决策后与之展开Cournot 竞争 企业1和2的产出水平分别为q 1 和q 2 。 假设p(q 1 ,q 2 )=10-q 1 -q 2 企业1收益 不投资: 投 资: 企业2收益: 1 1 21 (8 ) q qq = 1 1 21 (10 ) q qq f = 2 1 22 (8 ) q

43、qq =53 中国科学技术大学管理学院 2013 Cournot Game 1 1 1 1 21 2 1 22 12 12 (10 ) (8 ) ( , ) (4, 2) ( , ) (16 , 4) q qq f q qq qq f = = = = Cournot Game 2 1 1 21 2 1 22 12 12 (8 ) (8 ) ( , ) ( 8/3 ,8/3 ) ( , ) (64 / 9,64 / 9) q qq q qq qq = = = = 1. 若f 16-64/9 ,企业1不投资 3. 若f = 16-64/9 ,企 业1投资与否等效,对企业2收益有影响, 视企业1对企

44、业2的态度而定54 中国科学技术大学管理学院 2013 子博弈(Subgame) 子博弈(Subgame):动态博弈( 扩展式 博弈 树)中 满足如 下准 则的任意部分 (1) 以 原 博弈的某一 单结点信 息集的 决策结 点为初始 结点( 树根) : h(x 0 )=x 0 ; (2) 包 含 原博弈中此 决策结点 的所有 后继T(x 0 ) ; (3) 被 包 含的任一结 点所处信 息集中 的所有 结点也都 被包含 其中 xT(x 0 ),若x h(x) ,那么x T(x 0 ) 。 注 : 在很多文 献中, 将满足(1) 和(2) 的称 为 子 博弈(Subgame) , 而 将 还满足

45、(3)的称为 适当子博 弈(proper subgame)55 中国科学技术大学管理学院 2013 子博弈(Subgame) 子博弈的性质: 原博弈本身是个子博弈 ; 如果原博弈的一个信息集中包含多个决策结点,那么此信息集中任一结点均 不能成为子博弈初始结点; 子博弈是原博弈树的一个 完整独立的子树 完整:从某一结点出发,覆盖所 有后继 独立:与子树外结点无“ 虚线” 相连, 即: 原博弈 的任意 信息 集不被 子博弈 分割 当博弈进行到子博弈的初始结点,局中人只须关注子博弈,博弈结果不会受 到影响 完美信息动态博弈的每个结点均开始一个子博弈 局中人能确切知道博弈是否到达子博弈56 中国科学技

46、术大学管理学院 2013 子博弈(Cont.) U B A A A A B A D L R L R U B A A A A B A D L R L R 博弈1:只有一个子博弈,即本身 博弈2:有三个子博弈。 不是子博弈 不是子博弈 是子博弈57 中国科学技术大学管理学院 2013 子博弈完美Nash均衡 Subgame Perfect Nash Equilibrium 又称“ 子博弈精炼Nash 均衡” 、“ 子博 弈完美均 衡” Selten的主要贡献 双矩阵划线法可能比博弈树逆向归纳法找出的均衡要多 双矩阵划线法 Nash均衡 博弈树逆向归纳法 子博弈完美Nash均衡 定义(Selten, 1965):若一个 策略组 合能给定 原博弈 每个 子博弈 的Nash均衡 ,则被称 为“ 子博 弈完美Nash 均衡” 注:此处的“ 策略组合”“行动组合”58 中国科学技术大学管

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报