1、博弈论与决策管理,主讲老师:王若文,王若文,湖南长沙人;1987年毕业于北京大学中兴通讯 企管部经理、总裁秘书 三一重工 人力资源总监、行政副总裁 彩虹集团 人力资源总监、副总裁 神州通集团 人力资源总监、培训总监 中华网CHINA.COM 中国区人力资源总监2003年 深圳首届“十大金领”人物之一; 2004年 深圳百名“特区之子”人物之一; 2010年 最受欢迎的“中式人本管理专家”; 2011年 金蝶公司全国巡场“领袖峰会”金牌主持 2013年 培训TOP100-最佳人力资源及领导力管理专家。清华大学总裁班、北京大学汇丰商学院、浙江大学、新疆财经大学、上海财经大学EMBA班特聘领导力和人
2、力资源讲师。,上 市 企 业,现职:广州通盈投资公司 董事长,七“到”轮回,获取思想,更在乎获得方法; 获得知识,更在乎解决问题。,P-4页,知道,悟到,做到,得到,优秀管理者的绝密八字,克服贪嗔痴 表达“好“心情,微笑、主动、回避、韬光 幽默、语气、适可、得让 谦卑、顺从、真诚、舍得,一打方法:,先处理好心情,再学习好课程,斯大林时代的苏联,一个乐队指挥坐火车时看乐谱,两个克格勃军官以为是密码,就将他抓了起来,他说那是柴可夫斯基的乐谱,但无无济于事。 第二天,克格勃告诉他,已把他的同伙柴可夫斯基也抓起来了,正在招供。 他们俩面临一种艰难的选择:如一方招供另一方不招,坦白者从宽判1年,抗拒者从
3、严判25年;如果双方都招供,则各以间谍罪判10年;如双方均不招供,克格勃无法定罪,各自坐牢3年。 他们被分别关押,请问应该招、还是不招?,招还是不招?这是个问题,可能的思想斗争是什么? 坦白的原因 1、可能会被判的很轻 2、最坏的结果-10,-1,比-25,-3要好 抵赖的原因 1、我没犯罪,不愿意招2、双方抵赖各-3,比双方坦白各-10好 3、人云:坦白从宽牢底坐穿,抗拒从严回家过年,一、博弈论简介,博弈论(Game Theory)又名对策论,游戏论 失火了,屋里人很多,你往哪个门跑这就是博弈你的行动结果不仅取决于你的策略选择,同时也取决于他人的策略选择。它研究个体或组织之间存在利益冲突情况
4、下如何进行最优决策。,博弈论是40年代数学家冯诺依曼和经济学家奥斯卡摩根斯坦首先提出的。在经济学、政治学、社会学获得了巨大的应用。 1994年诺贝尔经济学奖颁发给了3位博弈论专家: 纳什Nash 、泽尔腾Selten 、哈桑尼Harsanyi 。 中国人研究博弈论是有优势的: 三国演义孙子兵法三十六计厚黑学都是博弈论教材,如何在人与人的博弈中取得成功。,1994年诺贝尔经济学奖获得者:美国数学家John F. Nash; 德国经济学家Reinhard Selten; 美籍匈牙利经济学家John C. Harsanyi。,1928年Nash出生于美国,1950年获Princeton大学数学博士学
5、位,曾先后任教于MIT和Princeton大学。其博士论文非合作博弈首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的纳什均衡概念。,1930年 Selten出生于现属于波兰的德国城市,1961年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。 Selten的主要贡献是首次对分析动态策略交互作用深化了Nash均衡的概念。,1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士学位,后逃亡澳大利亚,再到美国,1954年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。 Harsanyi研究和分析了不完全信息博弈
6、,从而为信息经济学提供了一个理论基础。,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)获诺贝尔经济学奖。2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为该年度的诺贝尔经济学奖得主。2005年诺贝尔经济学奖授予罗伯特奥曼和托马斯谢林,以表彰他们“运用博弈论的分析方法对现实的政治、经济问题进行分析,改变了我们对冲突与合作的理解”。,博弈的分类,1、静态博弈与动态博弈 参与者行动的先后顺序,静态博弈是同时作出决策(不了解对手的决策方案)
7、,动态博弈是参与者先后作出决策(后行动的人知道先行动者的行动方案)。2、完全信息博弈与不完全信息博弈 对其他参与者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能确切了解其它决策者收益函数。3、合作博弈与非合作博弈 能否达成一个有约束力的协议,合作博弈强调集体理性。(经济学主要讨论非合作博弈)4、一次性博弈与重复博弈 博弈重复多次进行。(注意区分动态博弈),严格地讲, 博弈论并不是经济学的一个分支,它是一种方法,应用范围除经济学外,还包括政治学、军事学、外交学、国际关系学、犯罪学等。但为何博弈论受到经济学的重视呢?主要原因有:1、博弈论在经济学中得到最广泛、最成功的应用,尤其在寡头市场理
8、论中得到直接的应用。 2、博弈论的许多成果也是借助于经济学的例子来发展的,经济学家对博弈论的贡献最大。 3、博弈论与经济学的研究模式一样:理性人在给定约束条件追求自己的效用最大化。由于上述原因博弈论逐渐成为主流经济学最重要的组成部分。,二、博弈论基本模型,囚徒困境(完全信息静态博弈) (A、B共同犯罪被抓,警察分开审问)B A 坦白 不坦白A = 10年 A =25年B = 10年 B = 1年A = 1年 A =3年B = 25年 B = 3年,每一个人的结局不仅取决于自身的选择,同时也取决于对手的选择,不管B坦白不坦白,我坦白总是会少坐一些牢,1、囚徒博弈,囚徒困境(完全信息下的静态博弈)
9、,“囚徒的困境(Prisoners Dilemma)”,从博弈论角度看,这是一个存在占优均衡的博弈:因为对囚犯A,B来说,无论对方如何选择,“坦白”都是各自的最优选择。虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处等竞争性动机阻碍了它们达到更好的互利选择,我们将看到,寡头垄断厂商经常面临类似的困境。启示:个体理性决策常常导致集体非理性结果,“囚徒的困境”还对亚当斯密的“看不见的手”的原理提出挑战。 这位经济学圣人在国富论中的名言:“每个人都力图利用好他的资本,使其能实现最大的价值。一般说来,他并不企图增进公共福利,他所追求的仅仅是他个人的利益。
10、但在他这样做的时候,有一只看不见的手引导着他去实现另一种目标,这种目标并非是他本意所要追求的东西。通过追逐个人利益,他经常增进社会利益。” 按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 从某种意义上说,纳什提出的非合作博弈的囚徒悖论实际上动摇了西方经济学的基石。,例:投标总工程量50,贿赂成本5,甲乙双方实力相当甲贿赂 不贿赂,贿赂,不贿赂, , , , ,问题:贿赂还是不贿赂? 均衡:(贿赂,贿赂),乙,2、投标博弈,3、智猪博弈,背景:在猪圈里住着一大一小两头猪。它们从同一个食槽获得食物。但食槽的按钮与食物的出口分布在相反的两端。每按一次按钮,可得
11、10个单位食物,但需付出2个单位劳动。规则:若大猪按按钮:大猪吃6个单位,小猪吃4个单位;若小猪按按钮:大猪吃9个单位,小猪吃1个单位;若一起去按:大猪吃7个单位,小猪吃3个单位;问题:哪头猪将会去按按钮?小猪按 等待按 5,1 4,4等待 9,-1 0,0,大猪,经济学中,这头小猪也被称为“免费搭便车者” 现实社会之中的大猪和小猪何其之多: 山寨版的横行 股份公司治理中的大股东与小股东 大企业的人才培训与小企业的挖脚 股市中的散户跟随大户 体制改革中的出头者 职场团队中的小组长与组员 公共设施或基础设施投资:富人与穷人,4、斗鸡博弈,假设两只公鸡遇到一起,每只都有两个行动选择:进攻或后退。
12、后退是很丢面子的事情, 若鸡甲进攻,乙后退,则甲赢。双方前进,两败俱伤。,双方都没有占优策略 存在两个稳定的状态(纳什均衡):(-1,1);(1,-1),双方都避免两败俱伤,斗鸡博弈有两个纳什均衡,一方前进,另一方后退。由于有两个均衡点,结果无法预知。具体博弈结果还取决于其他因素。20世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的很好例子 。古巴导弹危机是冷战时期苏美之间最严重的一次危机,赫鲁晓夫1962年偷偷将导弹运到古巴对付美国,被美国U2飞机侦察到,美国派出携带核武器的战机、航母,威胁苏联限期从古巴撤出导弹。苏美这两只大公鸡均在考虑进还是退?战争的结果当然是两败俱伤,但任何一方退下来
13、则是很不光彩的事。博弈结果是苏联从古巴撤回了导弹,做了丢面子的“撤退的鸡”,而美国坚持了自己的策略,做了“不退的鸡”。当然为了给苏联面子,同时也担心战争,美国也从土耳其撤了一些导弹。,例: 两个寡头进行价格战博弈的收益矩阵。,三、博弈论中的均衡,博弈论中的均衡是一组稳定的博弈结果。双方均不愿先改变策略。博弈的均衡是稳定的,因而是可以预测的。,占优策略,又称支配性策略(dominant strategy) 此类博弈中存在一种策略,无论B选择何行动,该策略对A都是最优,则称此策略为博弈者A的占优策略。 在本例中,厂商A和厂商B都有不受他人策略影响的占优策略,即选择低价。 占优均衡,支配均衡 每个参
14、与者都有并都选择占优策略,由此实现的均衡称占优均衡。本例为(10,10)。,1、占优均衡,2、纳什均衡,纳什均衡(非合作性均衡): 纳什均衡是这样一组策略,它使所有博弈参与者都不能再提高其收益。此时,双方在对方给定的策略下均不愿意调整自己的策略。下例中,A有占优策略即正常价格策略,而厂商B没有占优策略,它必须根据A的占优策略来确定其战略选择,即其选择受A的选择的影响。,3、占优均衡与纳什均衡的区别,占优均衡:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。 纳什均衡:我所做的是:给定你所做的我所能做的最好的。你所做的是:给定我所做的你所能做的最好的。,占优均
15、衡是纳什均衡的一个特例,四、最大最小策略,迄今为止,对厂商行为的分析都建立在利润最大化基础上。但在一些竞争激烈的寡头垄断市场,冯诺依曼和摩根斯坦认为决策者也可能采取一种风险厌恶策略,即确保在最坏的结果中得到最好的结果。这种决策规则称最大最小策略(Maximin Strategy):博弈者在可能最少的利润方案中选择利润最大的方案。,风险与均衡,由于纳什均衡要求理性共识和一致预期,当人们可能犯小小的错误时,纳什均衡不一定被选择。如下面这个博弈中,假定你是A,则多数人将选择“下”而不是“上”。,上,下,左,右,8, 10,-1000,9,7, 6,6, 5,只要B有千分之一的 概率错误地选择右, A
16、的后果将是灾难性的,A将极力避免这种风险,因此会选择下。 所以,出现的不是纳什均衡,B,A,如果企业谋求利润最大化,将有两个纳什均衡,一家企业投资推出新产品,另一家企业不投资产品。最大最小策略,不是利润最大化策略,准确说,它是用来避免十分不利结果的。对企业1来说,如果它不投资新产品,利润最小是300万,如果它投资,利润最小是200万。对企业2数字也相同。两家企业都在最小利润中选最大值。结果是两家企业都不投资新产品。因为这样的策略能保证至少获得300万利润。,战略 不投资 投资,投资,4,4 3,6,6,3 2,2,厂商1,厂商2 (单位百万),不投资,双寡头企业都在考虑是否投资推出新产品。,最
17、大最小策略的结果并不是两种纳什均衡中的一种。 原因是这种决策所用的准则,不是利润最大化,而是避免亏损过多,最大最小策略是一种保守的策略。 不同的决策目标可能导致人们选择不同的策略,最终导致不同的博弈结果。,五、重复剔除严格劣战略,“重复剔除严格劣战略” 的思路如下: 1、首先找出博弈参与人的劣战略(dominated strategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”。 2、如果这样的解存在,该博弈是“重复剔除
18、占优可解的”。,连续排除劣势策略,两者都没有占优策略,怎么办?,玩家 2,玩家 1,100,100,90,110,50,120,策略,A,B,C,a,b,c,A,B,C,a,b,c,90,110,50,120,玩家 2,玩家 1,策略,普林斯顿大学的一道习题 题目:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城市,而敌军的守备力量是三个师,规定双方的兵力只能整师调动。 通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败。那么,你将如何制定攻城方案?,敌人,你方,(3,0);(2,1);(1,2);(0
19、,3),(2,0);(1,1);(0,2),其实,这次模拟“作战”,每一方取胜的概率都是50,即谁胜谁负的可能性是一半对一半。你这个司令能否神机妙算,指挥队伍克敌制胜,还得看你的本事。,六、重复博弈,“囚徒的困境”暗含有一次性博弈假定,结果陷入了个体理性决策导致(因为猜忌)集体非理性结果的困境。 现在我们改变假定条件,讨论博弈可以多次进行的重复博弈(Repeated Game)。如,囚徒困境博弈中,假定博弈或重复多次,A对B宣布如下方针:我将选择沉默,并要求你也如此来增进各自利益;然而,如果你半途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一方针与A利益一致,因而是可信的。,重复博弈中
20、,声誉(名声)十分重要,从B角度来看,和A合作可在每阶段得到较好结果;中途变卦,固然当期可得更好结果,但此后便每次面临更坏的后果,显然是不利的。 因而,重复性博弈中,“沉默+沉默”点可能成为对双方最佳选择,因而成为纳什均衡点。 由于博弈条件由一次性变为重复性,均衡状态随之发生变化。欺骗一次对方就会警觉,导致合作失败。在重复博弈中,名声对得出什么样的结果十分重要。,重复博弈导致合作的例子,越战纪实我的越战经历 http:/ 老兵们按住我“别打枪。” “为什麽?!?”我喝道。 他们给我解释了好久,因为这是不成文的规矩,双方默认的。你不开枪,我也不开,大家图个太平。他们告诉我,曾有一段时间,双方打得
21、不可开交,结果大家都躲著,屎尿都撒在猫耳洞里,加上潮湿(下一场雨,洞内积一星期水,人就蹲在脏水里),有人耳朵都发了霉,下身都烂掉了。最后是谁也打不著谁,自己活受罪。由此双方慢慢达成默契,我出来,你不开枪,你出来,我也不打,就这样。,我还以为上了战场就可以乱放枪呢,谁知竟有这麽多狗屁规矩。 “不过我们也不能全走出去,不然他给你来个一窝揣也说不定。每次出去一个,其他人守著。”他们警告我“如果有当官的来了就要特别小心,当官的不了解内情,一声令下,他们不想打也得打,你站在外面就活该倒霉。” 很有道理,我想我又上了一课,希望下课前我还没死。战场上不用考试的,不合格的学生全得死,没有补考的机会。这是个恐怖
22、的课堂!我想学校里如果成绩不佳就马上拉出去枪毙的话,学生们会怎样玩命学习呢。 类似的例子: 一战的战场上 “我们不开枪,你们不开枪” 标语,多个博弈论专家为此编制策略模型,两两配对进行比较,博弈反复多次进行,结果下述简单策略效果最好“针锋相对”策略:以合作开局,随后博弈参与者就模仿竞争对手上一期的行动,对手欺骗(削价),则下一期我也欺骗(削价)。如果对方采取合作态度(提价),则下期我也合作(提价)。,在非合作的、重复性博弈中,个体或企业有不取决于博弈内容的最优策略吗? 换言之:有没有一种简单的策略让我们可以在重复博弈中利益最大化?,针锋相对策略在重复博弈中的优势:1、简单,不易误解; 2、针锋
23、相对决不是先搞欺骗,先搞欺骗会导致合作瓦解; 3、决不怂恿欺骗行为,不允许对这类行为不加惩罚; 4、针锋相对是宽大的,它允许迅速恢复合作。可以说,这种策略既是毫不留情的,又是毫不记恨的。真正是“善有善报,恶有恶报”,而且“无论善恶,立即得报”。,毛主席的:人不犯我、我不犯人,人若犯我,我必犯人。,不幸的是,如果确定知道博弈次数,针锋相对的策略可能失效。每一方都企图在最后一次博弈搞欺骗(对手已没机会报复),前一次也没必要合作,又回到了囚徒困境模式。,七、行动有先后:顺序性博弈,通常的博弈不是参与者同时选择,即不是静态博弈。 在动态博弈中,各博弈方先后依次行动。,下面支付矩阵描述了一个博弈,如果同
24、时行动,它有两个纳什均衡点(“甜,咸”与“咸,甜”)。假定厂商A可以先推出甜饼干(如利润较高),我们就有了序列博弈:A先作决策,B随后选择。A决策时必须考虑竞争者的理性反应:它知道不论自己推出那种饼干,B出于自身利益会推出另一种。因而A推出甜饼干,B在给定A决策时选择咸饼干。结果两个纳什均衡点收敛为一个,其中A由于具有先行者优势(First Movers Advantage)而得到较大利益,,先行优势,沃尔玛进入 不进入进入 -1000,-1000 2500 ,0不进入 0, 3000 0,0最终的结果取决于谁先采取行动,如果一方抢先进入,另一方只能放弃。(很多企业宁愿亏损也要多处布点),家乐
25、福,钢铁大王安德鲁卡内基曾经说过:“第一个来的人得到了牡蛎,而第二个人只得到了贝壳。” 如果沃尔玛和家乐福两家公司都想在某一中小城市开设商业网点,由于市场容量有限,当两家公司都进入时,大家都可能亏损,规模上千亿美元的世界芯片市场提供了另一个例证:近十几年来,芯片的需求急剧膨胀,一方面源于个人电脑和手机爆炸性需求的拉动,另一方面诸如汽车、立体声设备等产品的日益电子化、精密化。进行新投资的时间问题是这一行业经营制胜的重要一环。建立一个芯片工厂往往要耗资十亿多美元,但设备在3-5年内就会过时。 80年代初,美国半导体企业垄断了整个芯片行业。1984年,价格的下降使得Intel和德州仪器推迟了建立新的
26、芯片工厂的计划。预计到这个形势,东芝、NEC和Oki电子公司等日本企业马上作出反应,投资增加新的生产能力。80年代末,日本企业占领了世界芯片市场的80%,而美国企业只有可怜的15%,一些美国企业如英特尔干脆退出了低端芯片行业。,1990年代,这种机制又得到重演,这次扮演扩大生产能力进攻者角色的是韩国。1990年前后,正处于行业衰退中,主要日本厂商都减少了芯片生产规模,同时,日本经济进入萧条状态,导致筹措资金步履维艰,因此,日本企业推迟了兴建新的芯片工厂的计划。相反,韩国现代,三星和金星电子等则纷纷斥巨资兴建芯片工厂。到1994年,韩国已经占有世界芯片市场36%的份额,三星也成为世界最大的芯片生
27、产厂商。 1990年代中后期,台湾也加入了该产业的博弈行动中,获得了较大的市场份额。 这些公司赢得优势的主要做法之一就是在商业周期低谷时大量投资,形成过剩生产能力。等到经济开始复苏,其他竞争对手发现再投资已无利可图。,八、言语博弈:威胁和承诺,为了在博弈中获得对已有利的结果,往往会产生“威胁”和“承诺”的行为。 语言哲学认为,语言就是行动。 言语博弈涉及:声称的策略和实际的策略。现实中,各国的外交声明,企业发出的威胁等。伊拉克对美国:如果你打我们,我就使用大规模杀伤性武器。 台湾问题:美国声称,如果中国武力攻打台湾,美国将介入。中国声称,是否收回台湾是中国内政,中国原来的不率先使用核武器的声明
28、在国内战争中不适用,温家宝的“不惜一切代价”。中国用“不首先使用核武器”的承诺。,1、威胁:可信的与不可信的,B公司降价 不降价降价 100,200 200,-100不降价 600,1000 1000,700,A公司,A公司降价的威胁可信吗?不可信! 如果A公司要让B公司相信其威胁是可信的, 只有一个途径:建立一种不按牌理出牌的形象。,公司之间经常相互发出信号以表明他们的意图、动机和目标。有些信号是威胁性的。 例如,A公司宣布,如果谁挑起价格战,它将坚决奉陪到底,并宣称其规模在本行业中名列前茅,最有降价的实力。 是否所有的威胁都是可信的?,2、威胁的可信度,以前述饼干生产厂为例:先行者有优势,
29、但在双方都没投产之前,厂商B宣布不管其他厂家如何,他都将投产甜饼干,当然A可能没有理由非得相信他。 此时B订购大宗蔗糖合同,同时投放昂贵广告,传达相关信息。A可能就会放弃。只有威胁变得可信时才会生效。 此策略可能很有效,但很危险,取决于对信息的充分了解。 不按常理出牌,而形成一种非理性或“疯子”的名声,在重复博弈中可能会大大增加获益的机会。,3、阻止市场进入的威胁,在一般的情况中,一个市场中不一定只能容纳一家企业。假定在一个市场中,某企业是市场垄断者。现在有另一企业作为潜在的竞争者,试图进入这个市场。对垄断者来说,会设法阻止潜在竞争者的进入。在这个博弈中,潜在竞争者有两种策略可以选择,即进入或
30、不进入;垄断者也有两种策略,或者与进入者打一场价格战,或者默许它的进入。该博弈的策略选择顺序是:首先由潜在进入者作出进入市场或不进入市场的选择,然后再由垄断者来决定是默许它的进入还是与进入者进行一场价格战。这个博弈的得益矩阵如表所示:,可信吗:垄断者对潜在进入者进行威胁: “如果你进入市场,我将采取价格战的策略”,空头威胁!,4、承诺与可信性,承诺,是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。 与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它不需要任何成本。 阻止市场进入的有效承诺就是通过投资来形成一部分剩余的生产能力。 这部分生产能力在没有其他企业进入市场
31、的时候是多余的,但在进入发生时则成为其低价竞争的有力武器。,生产能力的扩大需要额外的投入,我们假定垄断者需要投资800万元来实行这个承诺。这一投资将改变博弈的得益矩阵,新的得益矩阵如下表:,例:运用公布价格策略抢占市场,德克萨斯仪器公司宣布了DRAM两年内的价格。一周后,鲍默公司宣布以低于德克萨斯公司的价格生产这种产品。几周后,摩托罗拉也宣称将以比鲍默公司更低的价格生产这种产品。终于在几周后,德克萨斯公司宣布其价格比摩托罗拉公司的价格还要低50%,而其他两家公司则宣称经过慎重考虑,他们不打算生产这种产品。某公司的董事长听到这则消息后,认为应该学习德克萨斯公司的策略。他的公司计划开发一种新产品,
32、两年后投放市场,虽然其生产成本并不比同时进入市场的其他竞争性产品的成本低,但仍具有一定的竞争力。该董事长认为,应该将新产品的价格公布很低,目的是诱使其他企业放弃该新产品的开发计划。如果你是这家公司的顾问,你认为董事长公布一个较低的新产品价格有哪些好处和坏处?,某警察负责A、B两地治安,两地相隔较远,他每晚只能去一个地方巡逻,该地区有一小偷,他每晚也只能选择偷一个地方,A地财产价格2万元,B地财产价格1万元,若警察选A地巡逻,而小偷也选择去了A地,则会放弃偷窃,警察保全了3万元财产;若警察选择A巡逻,小偷去了B地,则B地财产被盗。问:警察如何巡逻效果最好?,策略1:警察只对A巡逻,这样可保住2万
33、元的财产不被窃。这个做法是最优的吗?有没有改进的措施?,策略2:既去A地,又去B地。那么去A地多少次,B地多少次最优?,九、混合策略博弈警察与小偷,显然,警察的最好做法是:通过掷骰子决定去A地还是B地,1/3的机会去B地,2/3的机会去A地。(对6个面的骰子,1-4点去A地,5、6点去B地。) 对小偷也是如此,掷骰子来决定是偷什么地方,只是1-4点去B地,5、6点去A地。,警察和小偷的损益分析: 警察到A地时,小偷有1/3机会到A,2/3机会去B,此时警察得益:同理警察到B地时,得益也为7/3。由于警察到A的可能为2/3,到B的可能为1/3,其总得益为:可以看出警察的总得益大于2,该策略优于只
34、巡逻A的策略1。 小偷的得益有什么改变呢?(2/3),该博弈为零和博弈(一方之所得,即为另一方之所失),只有混和策略均衡点,不会有纯策略的纳什均衡点。警察与小偷博弈如同剪刀-石头-布游戏,或猜拳游戏,是混合策略博弈,参与者在多种备选策略中随机选择。在这样的游戏中,不存在纯策略均衡(不能选择单一策略),对每个人来说,出剪刀、布、还是石头的策略应当是随机的,不能让对方知道自己的策略,哪怕是策略的“倾向性”,如果对方知道你出哪一个策略的可能性较大,你在游戏中输的可能性就增大。,二、策略式博弈数学基础,设在一个n人博弈中,诸局中人的策略集为S1,Sn,每个局中人的支付/收益为u1,un,都是定义在S1
35、S2Sn上的函数,我们将这个博弈记作G=S1,Sn; u1,un。这种表述方法称为博弈的策略型表述或者正规型表述。 博弈者采取Si策略的概率记为i,则收益ui=f(i , Si ),4,3,5,1,6,2,策略,L,M,R,U,M,D,玩家 2,玩家 1,1(U)+ 1(M)+ 1(D)=1,1=(1/3,1/3,1/3),1i=(0,1/2,1/2),则:U1=1/3(0*4+1/2*5+1/2*6)+1/3(0*2+1/2*8+1/2*3)+1/3(0*3+1/2*9+1/2*2)=11/2;,U2=27/6,某国有6个省,A、B、C、D、E、F,总统选举由这些省的代表投票选出,票数由不同
36、省人口比例分配。A10票,B9票,C7票,D3票,E1票,F1票,总数31票。候选人有两位,如某候选人获过半,即16票以上通过,就得以当选。立法也是如些,票数过半则通过。该政治体制运行了多年,但D、E、F的人民总觉得他们不同的声音往往得不到重视。试问该国的民主机制有什么问题吗?,十、公共选择理论(联盟博弈),虽然D、E、F分别有3票,1票,1票,但事实上在表决时,这3个省在任何情况下都不起作用。 因为他们不是任何获胜联盟的关键加入者。 现任总统知道了漏洞,提出要增加DEF的权力,但要求 : 1、人多的省权力要大些;2、人数少的地区也要有一定的权力;3、不要对现行制度作太大的修改,以免实施困难。
37、你认为如何对现行体制进行修改好呢?,最简单的方法是:多给A地区两张选票,总票数33张,获17张选票才能胜出,这样就能增加三个弱小省的权力。 提示:在合作博弈中,票数是一个虚假的指标,权力指数才真正起作用。(夏普里值,Shapley Value),权力指数:某一方作为关键加入者的获胜联盟的个数。 简例:A、B、C三人,A有两票,B、C各有一票,三人群体对某议题的表决,服从大多数原则,即若获3票,则通过,这三人各自的权力指数多大? 解:获胜联盟有:AB、AC、ABC,其中A在3个组合中均是关键加入者,而B,只对AB是关键加入者。所以A的权力指数是3,B的权力指数是1,而C的权力指数也是1。,总票3
38、1时各省权力指数,总票33时各省权力指数,从权力指数角度看股份公司案例五个股东A、B、C、D、E合资成立一股份公司,各出资20%,公司运行的两原则:1、一股一票原则;2、大多数原则(51%通过才能执行某决议)。第一年年底, A表示想增持一部分股份,而 B C D E愿意减持一些股份,但又不想让A控股,于是B C D E各减持了3%,A的股份为32%,BCDE各为17%。 第二年年初,A提出要B C D E各自再转让1%股份,B C D E一想,A持有的股份36%,不超过50%,就同意了,此时BCDE各有16%股份。请问:如果你是B,你会同意第一次减持3%吗?你会同意第二次减持1%吗?为什么?,
39、三人分配财产案假定有100万元,在三人间分配,A有50%的投票权,B有40%有投票权,C有10%,规则规定,当超过50%的票认可某方案,才能分配财产,否则三人一无所有。你认为分配的比例会是什么样的呢?A50万,B40万,C10万合理吗?,A50万,B40万,C10万,不合理,因为 C可以提出: A60万,B 0万,C40万 B可以提出: A70万,B30万,C 0万 C可以再提: A80万,B 0万,C20万当A分得太多,B、C都分得太少时,B和C会联合起来,宁可不得,这时A又会作出让步。多次博弈的均衡是,按权力指数来计算分配 (实践中还取决于每一方的谈判能力),民主的方式中,少数人支持的候选
40、人能赢吗? 一个n个人组成的社会,设n=300,对候选人A和B选举,如果全民投票,有2/3的人选B,只有1/3会选A,有没有一种办法设计一种规则,通过“民主的”投票使A当选呢?,答案是肯定的。民主规则也就是大多数原则,但具体实行方式可以商量。现在我们将这300人分成3组,每组中谁占多数,谁就赢得这一组,3组中赢得2组,就算赢了。(很公平吧!),现在我们假定第一组50人,第二组100人,第三组150人,第一组中有30人赞成A,第二组有60人赞成A,第三组中有10人赞成A,这样,A会赢得第一组和第二组的选举,从而顺利当选。如果不分组,直接选举,B会当选。,布坎南同意的计算举了一例,一个25人的社会
41、,只需9人同意某议案就可使它通过。分成5个区,每区5个人,只要3个区中的多数通过,即9个人,就能使某一议案通过。当人数更多时,数学计算表明,通过某议案只需总人数的1/4多一些即可,而无需多于1/2的人同意。如总数为39601人(199*199),只需10000人同意。,下述一次性选举: 有4个人,A、B、C、D,假定26%的人最喜欢A,各有25%的人喜欢B和C,有24%的人最喜欢D,假设B、C、D三个候选对象与A区别很大,喜欢他们三个的都最不喜欢A,现在进行一次性选举,谁可能当选?虽然有74%的人最不喜欢A,但A却当选了。,你可能会说,一次性选举不是就能避免上述问题吗?,公共选择与私人选择的不
42、同,不正当的结果也可能发生。 公民选举中,最不被喜欢的人可能当选。 例如台湾2000年大选,(陈、宋、连、李),民主投票的缺陷-不同的选举规则导致不同的结果台湾的选举是“民主选举”,各党派平等竞争。2000年台湾大选,四个候选人:宋楚瑜、连战、陈水扁、李敖。最终结果是陈水扁以微弱优势当选。假设台湾选举不是直选,选举规则是先角逐出两个候选人而不是多个候选人,然后再在这两个候选人间进行竞选,会出现什么结果呢?美国选举是间接选举,而台湾是直接选举。,与此相同的例子,中国申办2000年奥运会,投票规则是逐步淘汰制,每一轮得票最少的城市被淘汰。前两轮北京一直领先,剩下北京、悉尼、柏林,第三轮同样北京获选
43、票最多,柏林被淘汰,但最后一轮,北京与悉尼角逐时,北京却输了。,投票的悖论与阿罗不可能定律三个人(或三组)每一个都有一票,他们必须在跳舞、打牌、看电影 三种不同选项进行选择。这三个人有完全不同的意见:史密斯 打牌看电影跳舞布朗 看电影跳舞打牌琼斯 跳舞打牌看电影,在多数票规则下,每个人投出他最喜欢的票。 当 跳舞 与 打牌 表决时,跳舞 胜出,2:1 当打牌与看电影表决时,打牌 胜出,2:1 但是如果跳舞与看电影表决,是不是一定会赢呢? 主席在议会中的重要性:确定议程的权力就可能决定结果。,结论:加总社会个体成员偏好,不能得知社会的选择。多数投票制度并不能告诉我们社会真正想要什么结果。换而言之
44、, 不能简单地将民主理解为“少数服从多数”,阿罗:是否存在着任何能够避免循环结果的合理投票办法?,结论令人吃惊:那种能保证效率、尊重各人选择、并且不依赖议事日程的多数规则的投票办法是不存在的。民主与效率是存在矛盾的。 阿罗定理还告诉我们,民主并不象卢梭理解的那样能够达到“公意“,而是象波普尔理解的那样能够防止“最坏“的情况发生,从而严格论证了民主的功能究竟何在。,西方民主世界的领袖美国,经常发生 “议员选选民”的怪现象。“蜥蜴脚尾”现象 美国政治的两个重要特征。第一,美国社会表面上是个“大熔炉”,其实因种族、宗教、穷富等因素造成的社会分化极其严重,如2000年总统大选90以上黑人选民投票支持戈
45、尔,便是一例。第二,美国选区的划分,大都由各州州议会自行决定,是个可以上下其手的过程。举例说,假设美国选民总体对民主、共和两党的支持基本是一半对一半,那么只要一个选区的黑人比例超过全国平均值几个百分点,他们90投民主党的的选票,就会将这一选区变成民主党的“铁票”地盘。因此产生了美国选区地图的“蜥蜴脚尾”现象。 此名来自19世纪初的麻萨诸塞州州长杰里,他专搞选区划分手脚,以便自己和同党可以顺利当选,结果在地图上选区常常奇形怪状,就像蜥蜴,又长“脚”又长“尾巴” 。甚至出现过沿一条公路伸展几百英里、宽度却几乎不出一英里的怪物选区。,最近,得克萨斯州的共和党人凭在州议会的多数,强行重划选区,演出了“
46、蜥蜴脚尾”的新一幕。其中的精彩插曲,是州议会少数党民主党议员为了抵制,两次大批“逃亡”,使州议会不到法定人数,无法通过议案。结果共和党控制的州政府要求警方“通缉”逃亡的州议员,上演了一场闹剧。 民主党最后屈服,得州终于通过了新的国会选区划分,例如原先得州西部的第19选区如今像条细蛇,宛延伸展到得州中部。原先是民主党地盘的第11选区被完全重划,也是又细又长,目的是帮助布什总统的一个盟友当选众议员。得州南部的新选区地图像“一套细条纹西装”,由许多南北向的狭长选区组成,目的是将拉美裔的选民集中压缩到寥寥几个选区。 华盛顿邮报发表社论得克萨斯苏维埃共和国,批评得州的“蜥蜴脚尾”选区,实质上是“议员选选
47、民”,选举结果早由这些“蜥蜴脚尾”选区预定,和前苏联共产党统治下的“选举”并无不同。 美国以“民主典范”自居,老是要对其他国家指手划脚。可是美国自身的“蜥蜴脚尾”和近日“得克萨斯苏维埃共和国”故事,体现了西方谚语:自己住在玻璃房子里,最好别乱扔石头。,美国的人口演变大势,特别是少数民族人口的快速增长,总的来说对民主党有利。但是由于美国选举的“赢者通吃”制度,加上普遍的“蜥蜴脚尾”游戏,却造成对民主党十分不利的局面。 原来民主党支持者偏于下层收入者和少数族裔,这些族群的分布往往集中在城市,造成城市选区的民主党人高票当选,浪费大量票源。而共和党的支持者分布比较均匀,再加上“蜥蜴脚尾”选区划分,使得共和党可以在更多的选区胜出。 2000年总统大选,就是一个很好的例子。戈尔在全国赢得多数票,可是小布什却赢得更多的州,从而靠“选举人票”多数当选 总之,议员选选民的“蜥蜴脚尾”把戏,对美国政治有极重要的影响。在这样的“民主”制度下,例如布什政府这样的少数集团,尽管在环保、堕胎、枪支管制等方面并不代表美国多数民意,却能继续主导美国的政治。,