1、交通大学博弈论课程概要 (I)周林二零零四年十二月主要教材:博弈论(Fudenberg & Tirole)引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱.第一部分:完全信息策略式博弈 静态博弈1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数(FT 1.1)2. 策略式博弈的基本三解法:a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay, 易趣网)(FT 1.1)b. 重复剔除劣策略. 例子:双寡头 Cournot 竞争(线性需求) (FT 1.1, FT 2.1)c. Nash 均衡 ( 最重要的概念 ) (FT 1.2)三种解法的合理性依次减低,而三种解法的适用范围(存在性
2、)依次增加.3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个 Nash 均衡. (FT 1.3)证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是 Nash 均衡.利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动点.(注意:这里的最佳反应映射不是一个压缩映射, 因此不能用迭代法逼近不动点.)推论:任何有限策略博弈至少有一个混合策略 Nash 均衡.4. Nash 均衡一般非唯一,非 Pareto 最优. 可以通过外在信号机制改善收益.相关均衡:公共信号仅将不同的 Na
3、sh 均衡混合,私人信号更为有效.(FT 2.2)作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T). 以及下面的题目:A 证明任何一个满足 Nash 均衡存在性定理的对称博弈(首先给出一个合理的定义)一定存在一个对称的 Nash 均衡.B 画出下列博弈中所有的相关均衡生成的收益向量:博弈者 2博弈者 1 T WT -1, -1 2, 1W 1, 2 5/3, 5/3第二部分:完全信息扩展式博弈 动态博弈1. 例子:斯塔克伯格模型 (FT 3.1)2. 多阶段可观察行为博弈 (FT 3.3.2)0 阶段: 每一个博弈者可以独立选择一个行动 . iiAa01
4、阶段: 在本阶段前的历史 决定了本阶段每一个博),(011nah弈者可以选择的行动的范围 . 每一个博弈者再独立选择Ai一个行动 .)(11aiik 阶段: 在本阶段前的历史 决定了本阶段每一个),(110kkah博弈者可以选择的行动的范围 . 每一个博弈者再独立选择一)kiA个行动 .)(kikiAa博弈在 K 阶段后中止.(我们允许 K 为无穷,此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史 : .),(101Kah )(1iihu(不一定每一个博弈者在任何一个阶段 k 和历史 时都要做选择. 此时kh我们只要让 即可.)kihA3. 多阶段可观察行为博弈的策略式博
5、弈表示(FT 3.3.2)策略空间: 每一个博弈者的策略是一个完整的计划,包括了在所有的阶段 k 和所 有可能发生的历史 时会采取怎样的相应行动(想象一kh本理想化的棋谱). 收益函数: 对于任何一个所有博弈者的策略的组合,我们可以逐阶段的找出相应博弈者行动的历史,从而决定每一个博弈者获得的收益.4. 多阶段可观察行为博弈的求解(FT 3.5)对任何一个多阶段可观察行为博弈,我们首先可以找出它的策略式博弈的 Nash 均衡. 但是其中可能含有不合理的解,我们需要对 Nash 均衡进行挑选(精炼). 4.1. 逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈 .4.2. 子博弈完美: 可以用于
6、所有的多阶段可观察行为博弈 .一个多阶段可观察行为博弈 G 在任何一个历史 后的延续本身kh也是一个博弈. 我们称其为原博弈 G 的一个子博弈 , 记为 . )(khG如果 G 的一个 Nash 均衡在它所有的子博弈上的限制也是子博弈的一个 Nash 均衡,我们称之为一个子博弈完美的 Nash 均衡.5. 子博弈完美 Nash 均衡的判断条件:单阶段偏离原则* (FT 3.3.2)6. 子博弈完美 Nash 均衡的应用:囚徒困境的重复博弈, 有限和无限情况(FT 4.3)7. 子博弈完美 Nash 均衡的应用:Rubinstein 议价模型(FT 4.4)作业:3.3,3.5, 3.7, 3.
7、8, 4.5(a)(b), 4.8 . 以及下面的题目:A 证明:在囚徒困境的有限重复博弈中,任何一个 Nash 均衡(不管是否子博弈完美)的途径一定是每阶段 (不合作, 不合作). B G 是一个静态双人策略式博弈. 每个博弈者有两个选择变量:博弈者一选择 和 ,博弈者二选择 和 . 假设 是 G 的1xy2xy),(,*2*1yxNash 均衡. 现在我们将 G 变化为一个双人两阶段博弈 . 在阶段 0 时人博弈者G一 选择 ,博弈者二选择 . 在阶段 1 时,当双方都观测到 和 之12 12后,博弈者一再选择 ,博弈者二再选择 . 的子博弈完美 Nash 1y2y均衡同 G 的 Nash 均衡是否一样?请仔细解释.