1、博弈论及其应用博弈论及生活中的应用(一)博弈论博弈论是专门研究两个或两个以上利益有冲突的个体,在相互作用下如何进行各自优化决策的理论。有时也称为对策论,或者赛距理论。是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈这一词语最早
2、来源于棋弈。精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,而此时博弈论也扩展到了研究个体如何在错综复杂的相互影响中得出最合理的策略。博弈论的历史:1.萌芽时期:18 世纪甚至更早,瓦德格拉夫(Waldegrave)在 1713 年提出两人博弈的极小化极大混合策略解; 库诺特(Cournot)在 1838 年、伯特兰德(Bertrand)在1883 年分别提出了博弈论中
3、经典的经济学模型;公元前,我国的齐威王田忌赛马的博弈思想,1500 年前巴比伦犹太教法典中的“婚姻合同问题” 。2.早期研究:源于上世纪初,1913 年齐默罗(Zermelo)提出了关于象棋博弈的定理是博弈论的第一个定理,提出的“逆推归纳法”(Backward Induction Procedure)则是博弈论的第一种有着一般意义的分析方法; 冯.诺伊曼(Von Neumann)和摩根斯坦(Morgenstern)在1928 年给出了扩展形博弈定义,证明了有限策略的两人零和博弈有确定的结果等3.博弈论的形成:冯.诺伊曼(Von Neumann)和摩根斯坦(Morgenstern)1944 年出
4、版了博弈论和经济行为(Theory of Gamesand Economic Behavior),在该著作中,引进了博弈论的扩展形(Extensive Form)和正规形(Normal Form)或称策略形(Strategy)、矩阵形(Matrix Form), 定义了极小化极大解(Minmax Solution),并说明了解在所有两人零和博弈中的存在性,且提出了创建博弈论的一般理论的想法,给出了博弈论的一般框架、概念术语和表示方法. 博弈论和经济行为的出版被公认为博弈论初步形成的标志。4.博弈论的成长: 美国数学家约翰.纳什(John Nash)在 1950 年提出了将博弈论扩展到非零和博弈
5、,最终成为非合作博弈理论基石的成果“纳什均衡”(Nash Equilibrium)及纳什定理.纳什均衡被誉为现代博弈论中最重要的概念,随着博弈论和经济学的发展,纳什均衡现在已经成为大多数现代经济分析的出发点和关键分析概念.5.博弈论的发展:最重要的成果是塞尔腾(R.Selten)在 1965 年提出了空头威胁”(Empty Threats)的问题,并提出“子博弈精炼纳什均衡 ”(Subgame Perfect Nash Equilibrium)对纳什均衡作完美化精炼的思想.更在 1975 年提出了“颤抖手均衡”(Trembling Hand Perfect Equilibrium)概念。海萨尼
6、(J.Harsanyi)在 1967-1968 年发表构造了不完全信息(Incomplete Information)博弈理论的系列论文,提出了分析不完全信息博弈问题的标准方法,以及“贝叶斯纳什均衡”(Bayesian Nash Equilibrium)的概念,在1973 年提出了关于“混合策略”的不完全信息解释以及“严格纳什均衡”(Strict Nash Equilibrium)的概念.6.博弈论的成熟以及与主流经济学的融合: 在该时期,博弈论开始真正受到经济学家的广泛关注,并被看作重要的经济理论和经济学的核心分析方法,开始贯穿几乎整个微观经济学和产业组织理论,在环境、劳动、福利、国际经济学
7、等学科中的地位也越来越重要,大有“吞噬”整个现代西方经济理论的气势. 1996 年,博弈论和信息经济学家莫里斯(James A.Mirrless) 和维克瑞(William Vickrey)因为在不对称信息条件下激励机制问题方面的基础性研究而再次共同获得诺贝尔经济学奖.博弈论的分类,一是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是非合作博弈。非合作博弈可以得到四种不同的类型:完全信息静态博弈-纳什均衡,完全信息动态博弈论-子博弈精炼纳什
8、均衡,不完全信息静态博弈-贝叶斯纳什均衡,不完全信息动态博弈-精炼贝叶斯纳什均衡二是分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。人们平常所说的“损人利己”实际上也包含有零和博弈的意思。常和博弈则是指所有博弈方的得益总和等于非零的常数。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。如在同一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。三是分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静
9、态博弈。动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。四是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。博弈论的意义,面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样从理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯诺伊曼于 20 世纪 20 年代开始创立,1944 年他与经济学家奥斯卡摩根斯特恩合作出版的巨著博弈论与经济行为,标志着现代系统博弈理论的初步形成。诺伊曼从数学上证明了竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最
10、大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。博弈论举例,在博弈论中最著名的例子应该是纳什(John Nash)编制的博弈论经典故事“囚徒困境“了,它说明了非合作博弈及其均衡解的成立,故称“纳什平衡“。 假 设 有 两个 小 偷 A 和 B 联 合 犯 事 、 私 入 民 宅 被 警 察 抓 住 。 警 方 将 两 人 分 别 置 于 不 同 的 两 个 房 间内 进 行 审 讯 , 对 每 一 个 犯 罪 嫌 疑 人 , 警 方 给 出 的 政 策 是 : 如 果
11、一 个 犯 罪 嫌 疑 人 坦 白 了 罪行 , 交 出 了 赃 物 , 于 是 证 据 确 凿 , 两 人 都 被 判 有 罪 。 如 果 另 一 个 犯 罪 嫌 疑 人 也 作 了 坦 白 ,则 两 人 各 被 判 刑 8 年 ; 如 果 另 一 个 犯 罪 嫌 人 没 有 坦 白 而 是 抵 赖 , 则 以 妨 碍 公 务 罪 ( 因已 有 证 据 表 明 其 有 罪 ) 再 加 刑 2 年 , 而 坦 白 者 有 功 被 减 刑 8 年 , 立 即 释 放 。 如 果 两 人都 抵 赖 , 则 警 方 因 证 据 不 足 不 能 判 两 人 的 偷 窃 罪 , 但 可 以 私 入 民
12、宅 的 罪 名 将 两 人 各 判 入狱 1 年 。 于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。在 表 中 的 四 种 行 动 选 择 组 合 中 ,( 抵 赖 、 抵 赖 ) 是 帕 累 托 最 优 的 , 因 为 偏 离 这 个 行 动 选 择 组 合 的 任 何 其 他 行 动 选 择 组 合都 至 少 会 使 一 个 人 的 境 况 变 差 。 不 难 看 出
13、 , “坦 白 ”是 任 一 犯 罪 嫌 疑 人 的 占 优 战 略 ,而 ( 坦 白 , 坦 白 ) 是 一 个 占 优 战 略 均 衡 。 囚徒困境的关键就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。AB 坦白 抵赖坦白 -8,-8 0,-10抵赖 -10,0 -1,-1(二)博弈论在生活中的应用博弈论在生活中的应用,在下棋、赌博、扑克等娱乐活动中也可应用博弈论取胜。一个简单的例子是赛马,如果竞争双方各有优,中,劣 3 匹马,则如果知道对方的出马顺序,则第 2 赛者可稳赢,就是以优
14、、中、劣分别去和对方的中、劣、优比赛,便可获得二胜一负成绩最终胜出。但如果要求双方同时提出赛马出场顺序则就成为较难的问题 。这就要根据对方安排赛马出场的习惯来决定自己出马,使自己的胜算最大。还有就是我们学生常遇到的考场博弈,博弈双方为学生与监考教师。学生的决策目标是通过考试作弊时机的选择,来实现其考试净收益的最大化;监考教师的决策目标是通过监考偷懒时机的选择,来实现其监考净收益的最大化。学生有作弊和不作弊两种策略选择,教师监考有严和不严两种策略选择。最后由混合策略纳什均衡得到,学生作弊的概率其实是和监考教师的效用有关系的;监考教师监考严厉与否的概率是取决于学生的效用的。由于学生作弊被逮住后的处
15、分非常严厉,设其效用为-10;现在学校对监考不严的教师处罚比较低,甚至没有实际的处罚,我们设学生作弊而教师监考不严学生的效用为 3,教师的效用为-1;教师监考不严(在学生没有作弊的情况下)的效用为 2。可以得出教师会以 0.23 的概率选择监考严厉,0.77 的概率选择监考不严厉。学校对学生作弊行为加大处罚并不能抑制学生作弊,其主要作用是使教师有更多的机会监考不严。同理,学生会以 0.67 的概率选择作弊,0.37 的概率选择不作弊。这就是学生与老师的一场博弈。日常生活中一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可在我们大多数人看来贸易争端用博弈论来分析是可以的,但对自
16、己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏? 实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝现在有两种策略,让人生病或不生病。人一旦生病,不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。(三)总结总而言之,博弈论在我们的现实生活中无处不在。在日常生活中,人们可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题。博弈论博大精深,自古非智者而不能为也。但是在我们日常的生
17、活之中,博弈论也是普遍存在的。博弈论是迄今为止经济学最重要的工具,甚至也是整个社会科学最重要的工具,是浓缩的人类社会的真谛正是因为如此,诺贝尔经济学奖获得者保罗萨缪尔逊(PaulSamuelSon)说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”参考文献 :【1】周正。浅谈对博弈论的认识和例证。法律经济学网【2】刘晨。博弈论在生活中的应用。法律经济学网【3】华长生。博弈论历史和分类。江西财经大学数学与管理工程系【4】刁勤华 林济铿 倪以信 陈寿孙。博弈论及其在电力市场中的应用。万方-贵大镜像【5】庞瑞。博弈论在生活中的应用。今日财富学术探讨 2008年 11 月【6】博弈论。百度百科【7】博弈论分类总结-.