1、第十章 博弈论初步,江苏大学人文社会科学学院,西方经济学,本章要点,一、博弈论和策略行为 二、同时博弈:纯策略行为 三、同时博弈:混合策略行为 四、序贯博弈,第一节 博弈论和策略行为,博弈论是描述和研究行为者之间策略相互依存和相互 作用的一种决策理论(如同下棋)。,一、博弈论的基本概念,策略:如果出现了什么情况(比如,对手采取什么行动),那么,我该采取什么行动。,支付(报酬):博弈带给参与者的效用或结果。,支付(报酬)矩阵:以各种策略组合所对应的效用值而构建的矩阵。,博弈均衡:博弈中所有参与者各自采取了最优策略而 产生的一个策略组合。,第一节 博弈论和策略行为,博弈论是描述和研究行为者之间策略
2、相互依存和相互 作用的一种决策理论(如同下棋)。,二、博弈的基本要素,参与人:在博弈中进行决策的人个。 参与人的策略:根据规则选择如何行动。 参与人的支付:博弈完成后参与人得到的效用。,第一节 博弈论和策略行为,博弈论是描述和研究行为者之间策略相互依存和相互 作用的一种决策理论(如同下棋)。,三、博弈的类型,二人博弈和多人博弈; 零和博弈和非零和博弈; 限有博弈和无限博弈; 同时博弈和序贯博弈。,第二节 同时博弈:纯策略均衡,“同时”、“序贯”的界定:,“同时”是指:每一个决策人在决策之前都不知道其他参与人的决策,从而进行决策或行动,这种状态称为“同时博弈”。,“序贯”是指:每一个参与人的决策
3、和行动,是有先有后的博弈,这种博弈过程称为“序贯博弈”。,第二节 同时博弈:纯策略均衡,一、寡头博弈,构成要件: 寡头市场,只有两个厂商; 每个厂商只有两个选择,合作或不合作。,如果合作: 行为:组成垄断组织,共谋价格与产量。 结果:分别得到较多的支付,比如:甲得到5个单位的支付,乙得到6个单位的支付。,如果都不合作: 行为:消极地以自己的产量去适应对方的产量(古诺模型)。 结果:分别得到较少的支付,比如:甲得到2个单位的支付,乙得到3个单位的支付。,第二节 同时博弈:纯策略均衡,一、寡头博弈,如果一方采取合作另一方采取不合作策略 博弈及结果: 甲方采取合作策略,乙方采取不合作策略。甲方执行垄
4、断价格,乙方秘密降价,甲方得到1个单位的支付,乙得到5个单位的支付。 甲方采取不合作策略,乙方采取合作策略。甲方秘密降价,乙方执行垄断价格,甲方得到7个单位的支付,乙得到1个单位的支付。,基本结论: 双方采取合作是一个好的策略,双方不合作是一个坏的策略(会招致对方的报复)。,第二节 同时博弈:纯策略均衡,二、博弈矩阵(支付矩阵),定义: 两人同时进行决策博弈的情况,用二元数组列出矩阵,进行描述和分析,称为博弈矩阵。,表 10-1,表10-1,列出了甲乙双方合作与不合作的各种情况下,各自得到的支付。,第二节 同时博弈:纯策略均衡,三、条件策略和条件策略组合,表 10-1,甲厂商的决策: 如果乙方
5、选择合作(条件),则甲方最好选择不合作(策略),这个策略的甲方得到的支付是7个单位。,不合作是甲厂商此时的最优策略。 甲厂商在乙厂商选择合作条件下的最优策略(甲厂商不合作的策略)称为甲厂商的条件优势策略,简称条件策略。,与甲厂商的这一条件优势策略相联系的策略组合,叫做甲厂商的条件优势策略组合(甲不合作+乙合作)。 简称条件策略组合。,第二节 同时博弈:纯策略均衡,三、条件策略和条件策略组合,表 10-1,条件策略: 参与人在给定条件下的相对优势策略。 比如,已明知其他参与人采取什么策略的情况下,定下己方的策略。,条件策略组合: 参与人的策略和其他参与人的策略构成的组合。 比如,在甲厂商选择合作
6、条件下,乙厂商也选择合作,此时就乙方而言,“合作+合作”,就是条件策略组合。,第二节 同时博弈:纯策略均衡,三、条件策略和条件策略组合,表 10-1,条件: 乙厂商选择不合作。 策略: 甲厂商应该选择什么策略?,第二节 同时博弈:纯策略均衡,三、条件策略和条件策略组合,表 10-1,甲厂商的两个策略组合: 不合作+合作 不合作+不合作,乙厂商的两个策略组合: 合作+合作 不合作+不合作,第二节 同时博弈:纯策略均衡,四、纳什均衡,表 10-1,条件策略组合实际上代表某种条件下的一种均衡。,甲厂商的一个策略组合(不合作+合作)是最优的,因此,他没有改变自己策略的倾向(尽管乙厂商有可能改变选择)。
7、,乙厂商的一个策略组合(合作+合作)是最优的,因此,他没有改变自己策略的倾向(尽管甲厂商有可能改变选择)。,只有在一种情况下,双方都没有改变策略的可能 : 不合作+不合作,当两个厂商的条件策略组合正好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈过程就达到了某种均衡。这种均衡就称为“纳什均衡”。,第二节 同时博弈:纯策略均衡,四、纳什均衡,表 10-1,纳什均衡: 指参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。,纳什均衡: 如果在一个策略组合中,当所有其他人都不改变策略时,没有人会单独改变自己策略,则该策略组合就是纳什均衡。,纳什均衡中的关注点:
8、 单独改变策略(其他人策略不变) 不会得到好处(得到的支付不会增加),第二节 同时博弈:纯策略均衡,五、寻找纳什均衡的方法,表 10-1,条件策略下划线法: 1、在每一方的优先策略获得的支付下,划一下划线。,2、找到两个数字都有下划线的方格,就是均衡策略组合。,第二节 同时博弈:纯策略均衡,六、纳什均衡的存在性、唯一性和最优性,1、存在性 在双方同时博弈中,纳什均衡有可能存在,也可能不存在。(表10-2,没有一个单元格的数字是都有下划线的),第二节 同时博弈:纯策略均衡,六、纳什均衡的存在性、唯一性和最优性,2、唯一性 在纳什均衡的条件下,解有可能是唯一的,也可能不是唯一的。(有二个单元格的数
9、字是都有下划线的),表10-3,当纳什均衡不存在或不唯一时,无法对博弈的最终结果做出肯定的说明。,第二节 同时博弈:纯策略均衡,六、纳什均衡的存在性、唯一性和最优性,3、最优性 如果纳什均衡存在,它既可以是最优的,也可能不是最优的。,表10-3,表10-3中,右下方的均衡不是最优。 表10-1中,纳什均衡(不合作+不合作)也不是最优。,第二节 同时博弈:纯策略均衡,六、纳什均衡的存在性、唯一性和最优性,4、纳什均衡实例,囚徒困境是一种占优策略均衡,每个囚徒占优策略都是坦白,策略组合(坦白,坦白)就是该博弈的占优策略均衡,同时,也属纳什均衡。,在“囚徒困境”中,(坦白、坦白)并不是博弈者共同的最
10、优结果,因为每个人都被判5年徒刑。他们共同的最优结果应该是各判2年,但却是无法实现的。 “囚徒困境”常常被经济学家作为一个经典案例用来说明:自利的个人理性行为并没有导致一个社会的最佳结果,亦即个人理性与集体理性之间存在着深刻的冲突。,第二节 同时博弈:纯策略均衡,七、二人同时博弈的一般理论(略),第三节 同时博弈:混合策略均衡(略),第四节 序贯博弈,条件: 参与人的决策有先有后,后行动的参与人可以观察到先行动的参与人已经采取的策略。,第四节 序贯博弈,一、例子:竞争者-垄断者博弈一个现有的垄断者与一个潜在的竞争者之间的博弈。,先决策:竞争先做出决策,是进入还是不进入由垄断者独占的市场。 后决
11、策:垄断后决策,对进入者的行为是抵抗还是容忍。,第四节 序贯博弈,二、博弈树(扩展式博弈模型),先决策:竞争先做出决策,是进入还是不进入由垄断者独占的市场。 后决策:垄断后决策,对进入者的行为是抵抗还是容忍。,根(起点):是序贯博弈开始的地地方:a。,扩展线:代表一种决策。,中间点:代表跟进决策者。,终点:策略组合和支付组合。,终点共有:四个策略组合、四个支付组合。,第四节 序贯博弈,三、纳什均衡,图10-7中的纳什均衡是:进入+容忍,分别得到支付是1,4。,图10-7中,只有一个纳什均衡,其他决策组合都不是,至少有一方单独改变会增加己方的利益。,在序贯博弈中,纳什均衡也可能不止一个。,第四节
12、 序贯博弈,三、纳什均衡,图10-8 情侣博弈,双方都有二个选择:看足球或看芭蕾。,男方先决策,女方跟进决策,形成四个策略组合。,四个策略组合中,有二个是纳什均衡:足球+足球;芭蕾+芭蕾。,其余二个策略组合都不是纳什均衡。,第四节 序贯博弈,四、纳什均衡精炼:逆向归纳法,图10-9、10-10 精练之一,二个纳什均衡的特点:男方选择足球或芭蕾,女方跟进与男方相同(图10-9)。,女方的选择完全由男方的选择所决定。,既然女方的决定服从于男方,男方就可以选择最有利于己方的决策:足球。(图10-10),第四节 序贯博弈,四、纳什均衡精炼:逆向归纳法,图10-11 精练之二,女方先行动,则会形成有利于
13、女方的纳什均衡:芭蕾+芭蕾。,先动优势:先行动者的得益大于后行动者。,逆向归纳的分析方法也适用于“垄断者、竞争者”博弈,参见教材318页。,第四节 序贯博弈,五、静态博弈、动态博弈和重复博弈,每个参与者只参加一次策略选择的博弈被称为静态博弈。 动态博弈是一种反复进行的博弈。 重复博弈是同一个博弈被重复多次,是动态博弈的一种特殊情况。,在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。促使每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。,在有限期重复博弈中,囚犯困境博弈的纳什均衡只能是参与者的不合作。然而,如果任何参与者都不能准确知道哪一次为最后一期,囚犯困境合作的均衡解是存在的:合作+合作。,第四节 序贯博弈,五、静态博弈、动态博弈和重复博弈,合作博弈的特点是参加博弈的各方在决策过程中联合起来,先追求共同利益的极大化,然后再分配这个已经极大化了的共同利益。,寡头厂商的价格与产量的串通就属于合作博弈。寡头行业的厂商通过相互勾结以达到协调行动的一种形式是建立卡特尔。 一个卡特尔是一个行业的各个独立的厂商,就价格、产量和其他诸如瓜分销售地区或分配利润等事项达成必须严格遵守的明确的协议,通常是正式的协议,这种协议就是合作博弈的均衡解。,