1、博弈论与生活中的经济学,柳庆宇,中央电视台百家论坛,博弈论(game theory)是由美国数学家冯诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影美丽心灵,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,1996年,两位将博弈论应用于不对称信息下机制
2、设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。,为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。,博弈论是一门十分有趣但理论上又是十分艰深的学问,我今天打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用,以
3、引起大家对这门目前已成为热门科学的兴趣和获得初步的了解。这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们。,1. 囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。,一、什么是博弈论:从“囚徒困境”谈起,表1 囚徒困境博弈乙 招 不招招甲 不招 (问题1:甲、乙如何选择?),尽管甲不知乙是否招供,但他认为自己选“招”最好,因而甲会选择“招”,乙也同样会选择“
4、招”,结果各判8年;但若两人都不招,结果是两人只被判1年,但这种结果是不会出现的。我们可以运用“剔除劣战略”的方法来获得这样的结果。,甲或乙可以作出的选择被称为“战略”,如“招”或“不招”都是战略。,对甲来说 ,尽管他不 知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。,甲和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈
5、支付矩阵。局中人所选择的战略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。,表1 囚徒困境博弈乙 招 不招招甲 不招,甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。我们可以利用这个道理来分析日常生活中的许多不合作现象。,2. 生活中的“囚徒困境”例子,例子1 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会
6、掉下来。,譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。,但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是
7、因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。,例子2 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损), “搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3,见表2。,表2 修路博弈乙 修 不修修甲 不修,我们看到,对甲和乙两家
8、居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。,这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。,例子3 苏格兰的草地为什么消失了?公共资源经常被过度利用的原因。在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量
9、,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。,由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。,如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,
10、我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。,类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。,例子4 为什么在城市中心道路上禁止汽 车鸣喇叭?禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是
11、基于以下的博弈论原因。见表3,当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付(2,2)。,表3 交通博弈司机2 缓行 抢行缓行司机1 抢行,但当对方缓行时,自己抢行会占便宜,获得支付9。这个博弈中,“缓行”是劣战略,剔除后得到“剔除劣战略后的占优战略均衡”(抢行,抢行),这不是一个好的均衡。当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果(缓行,缓行)。,例子5 为什么要加入WTO?WTO是一个自愿性申请加入的自由贸易联盟,即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国
12、家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。,1. 智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。
13、表4给出这个博弈的支付矩阵。,二、智猪博弈:对诸多经济现象的解释,表4 智猪博弈小猪 按 等待按大猪 等待,这个博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。,2. 例子,在经济生活中,有许多“智猪博弈”的例子。例子6 股
14、市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。,例子7 为何股份公司中的大股东才有投票权?在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。,例子8 为什么中小企业不会花钱去开发新产品?在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品
15、去销售。,例子9 为什么只有大企业才会花巨额金钱打广告?大企业是大猪,中小企业是小猪。大企业投入大量资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。,表5给出的博弈中,甲和乙都没有劣战略,所以,不能通过重复剔除劣战略获得博弈结果。,三、纳什均衡与商业中心区的形成,表5 存在纳什均衡的博弈乙 L M RU甲 D(问题2:甲和乙分别会选择什么战略?),当甲选“U”时,乙会选“R”;而当乙选“R”时,甲应该选“D”而不是“U”;但当甲选“D”时,乙会选“L”;给定乙选“L”,甲选“D”是最好的选择,他不会改变选择“D”;给定甲不改变选“D”,乙也不会改变其选择
16、“L”。所以,可以预期(D,L)是甲乙最终完成的稳定的选择。,称(D,L)为 “纳什均衡”。纳什均衡是局中人战略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。剔除劣战略的占优战略均衡和重复剔除劣战略的占优战略均衡是纳什均衡,但相反的结论不成立。,在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。对于这种现象,我们可以运用纳什均衡的概念来加以解释。甲乙1/2 图1 商业位置博弈,见图1,有一个长度为1单位的街道,在街道两边均匀地分布着居民。现有两家商店决定在街道上确定经营位置
17、。如果甲在街道中间位置1/2处设店,则乙的最好选择是紧靠甲的左边或右边设店。,当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位置设店是劣战略。所以给定甲在1/2处设店,乙在紧靠甲的左边或右边设店是最优的。反过来,给定乙在接近1/2处设店,甲的最优选择也是在1/2附近设店。这样,甲和乙挤在1/2处设店就是纳什均衡,这就是商业中心区的形成原理。,如果局中人在进行行动选择时有先后顺序之分,这种博弈就被称为“动态博弈”。 在图2中,有两个房地产开发商A和B分别决定在同一地段上开发一栋写字楼。
18、由于市场需求有限,如果他们都开发,则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,空置房太多导致各自亏损1百万。,四、动态博弈与承诺行动,当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润1百万。假定A先决策,B在看见A的决策后再决策是否开发写字楼。在图2中,用“博弈树”表示博弈过程。,图2 房地产开发博弈,在其中每一条“路径”的末端用向量给出A和B的支付,称为支付向量。下面用“逆向归纳法”可以求解这个博弈。在B进行决策的2个“决策结”上,B在左边的决策结上选择“不开发”;而在右边的决策结上选择“开发”。即给定A开发,B就不开发;给定A不开发,B就开发。B
19、应避免同时与A都选择开发而蒙受损失。,在这种情况下,A在自己的决策结上当然选择“开发”,因为他预计当自己选择“开发”后,B会选择“不开发”,自己就净赚一百万。当B威胁A说:“不管你是否开发,我都会在这里开发写字楼。”倘若A将B的话当了真,A就不敢开发,让B单独开发写字楼占便宜。但是,B的威胁是“不可置信”的。当A不理会B的威胁而果断地开发出一栋写字楼时,B其实不会将事前的威胁付诸实施。因为“识时务者为俊杰”,在A已开发的情况下,B的最优决策是“不开发”而不是“开发”。,但是,如果B在向A发出威胁的同时又当着A的面与第三者C打赌一定要在该地段上开发出一栋写字楼,否则输给C 2百万元。B与C为此签
20、定合同并加以公证有效。这时,博弈变成图3所示的动态博弈。,图3 承诺行动后房地产开发博弈,称B的这种行动为“承诺行动”,它使原来不可置信的威胁变为可以置信。这时,A就不得不相信B一定要开发写字楼的威胁了,于是放弃开发写字楼的计划,让B如愿以偿单独开发写字楼。B不仅未向C支付2百万元,反而净赚1百万。我们可以运用“承诺行动”的原理来分析许多经济及军事现象。,例子10 项羽的“破釜沉舟”。例子11 韩信赵国之战,“置之死地而后生”。例子12 欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴。欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争
21、的空中客车公司进行补贴。,当双方都未获得政府的补贴时,两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额利润,见表6。,表6 未补贴时的博弈空中客车 开发 不开发开发波音 不开发,此时有两个纳什均衡,即一家开发而另一家不开发。下面,考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两家都开发时,空中客车仍然盈利10单位而不是亏损,博弈矩阵见表7。,表7 有补贴时的博弈空中客车 开发 不开发开发波音 不开发,这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是
22、使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。,例子13 为什么大人物、大公司要聘请常年律师?,大人物、大公司对声誉十分看重,因而为一些不良人物或公司通过诽谤大人物、大公司企图迫使大人物、大公司花钱“私了”而获利。这是因为,尽管对于一些无端的指控,大人物、大公司可望通过法律手段(打官司)而出清了结,但打官司请律师会增加他们额外的成本。如果能花稍少一些钱“私了”,则既使自己清白又省钱,同时诽谤者也获得收入。,大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司
23、一旦受到无端诽谤必定会让他们吃官司。这样,大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。,例子14 如何以弱敌强,在战争史上,以弱胜强的例子是很多的。在商业竞争中,以弱敌强也是经常会遇到的情形。在二战中的诺曼底登陆战的谋略策划中,盟军就面临以弱敌强的问题。盟军有两个可以选择的登陆目标地,一是多佛,二是诺曼底。德国守军在人数上超过了盟军,并且就军事进攻而言,在人数相同的情况下,攻方与守方相比会处于不利的情形。,下面,将这种情形模型化。有一支军队准备进攻一座城市,它有军力两个师。守城军队有三个师。通往城市有甲、乙两条道路或方向。两军相遇时,人数居多的一方取胜,当两方人数相等
24、时,守方获胜。假定军队只能整师调动。,攻方战略:a=两个师集中沿甲方向进攻b=兵分两路,一个师沿甲方向进攻,另一个师沿乙方向进攻c=两个师集中沿乙方向进攻,守方战略:A=三个师集中守甲方向B=两个师守甲方向,一个师守乙方向C=一个师守甲方向,两个师守乙方向D=三个师集中守乙方向,用“+”、“”,分别表示胜和败,见下表,守方A B C D a进攻方 bc表1 以弱敌强博弈,用“重复剔除劣战略”分析:进攻方无劣战略,但守方有劣战略,A劣于B,D劣于C,故守方不会采用战略B和C,剔除后的博弈变为: 守方B C a进攻方 bc表2 守方剔除劣战略后的博弈,攻方知道守方不会选A和D,他由此知道博弈变成上图所示。此时,攻方就有一个劣战略b,他剔除b后得到新的博弈,见下表:守方a进攻方 b表3 攻方剔除劣战略后的博弈,此时,两方的形势是相同的,即攻方尽管开始在军力上劣于守方,但实际上它只要运用计谋,其获胜的可能与守方是相同的。,