博弈与社会(北京大学,张维迎).ppt-道客多多

资源描述

1、博弈与社会导论:个人理性与社会效率,张维迎教授北京大学光华管理学院,本章目录,社会问题；理性人行为；效率标准；外部性与科斯定理。,社会的两个基本问题,社会是什么？协调（coordination) 合作（cooperation),协调问题：以交通为例,靠左行,靠右行,靠左行,靠右行,A,B,1，,1,1，,1,-1，,-1,-1，,-1,协调与预测,协调问题的核心是预测（prediction)：预测其他人如何行为；个人行为的基本规则是什么？信息：too little knowledge; too much knowledge; fail to use the knowledg

2、e; no knowledge can help.,合作问题,合作,不合作,合作,不合作,A,B,3，,3,0，,0,-1，,4,4，,-1,合作与激励,合作问题的核心是激励(incentive) 个人行为与社会利益的冲突什么是个人的最优选择？什么是社会的最优选择？如何把个人行为与社会利益统一起来？,协调与合作相互作用,如交通问题；如密云元宵节惨剧；如SARS问题，禽流感问题；如恐怖主义问题；如股票市场；如宏观经济波动；等等。,社会问题及其解决办法,社会规模：小社会，大社会，全球化；技术问题：社会分工：社会制度：个人的行为规则正式制度；明规则，法律非正式制度；潜规则

3、，社会规范，文化价格制度；非价格制度。,理解人的行为,所有社会科学都是有关人的行为的科学，但不同学科的方法、假设、着眼点不同；经济学：从个人到社会(from micro to macro) 社会学：从社会到个人(from macro to micro) 心理学：用观察、实验的方法看人们实际上是怎么行为的。（行为科学）,Homo economicus vs. Homo sociologicus,Adam Smith vs. Emile Durkheim Rational, outcome-oriented; social norm-oriented, not outcome-oriente

4、d: “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is pulled by the prospect of future rewards, whereas the latter is pushed from behind by quasi-inertial forces.,Cont,The former adapts to changing circumstanc

5、es, always on the lookout for improvement. The latter is insensitive to circumstances, sticking to the prescribed behavior even if new and apparently better options become available. The former is easily caricatured as self-contained, asocial atom, and the latter as the mindless playing of social fo

6、rces.” (Jon Elster, 1989, JEP),为什么学习博弈论？,博弈论是有关“互动行为”(interactive behavior)的科学 “A sort of umbrella, or unified field theory for the rational side of social science. It develops methodologies that apply in principle to all interactive situations.”(Aumann and Hart, 1992) “It provides solid micro-found

7、ations for the study of social structure and social change.”(Jon Elster, 1982),Contd,“Nash Equilibrium has had a fundamental and pervasive impact in economics and the social science which is comparable to that of the discovery of the DNA double helix in the biological sciences. Nash formulated the b

8、asic vocabulary for a new language of economic analysis.”(R. Myerson, 1999,JEL) “More and more, the language of game theory has become the language of economics. More and more, pure theory came to mean game theory.” (Faruk Gul, 1997, JEP),博弈论的基本假设,理性假设（Rationality）: agents are instrumentally rationa

9、l; 共同知识（common knowledge of rationality) Know the rules of the game,关于理性人假设,理性人的定义：有一个很好定义的偏好（well-defined preference);在给定约束下追求偏好的最大化（maximization) 偏好是如何形成的？关于偏好的假设：完备性（completeness)：任何两个可选择的方案之间都是可比较的；传递性（transitivity):(偏好具有一致性）,偏好函数,如果偏好满足其他一些假设（特别是连续性假设），可以定义一个偏好函数或称效用函数（utility function);Lexi

10、cographic preferences endowment effect.,无差异曲线,X,Y,A,B,约束条件,技术性约束：如一天工作不能超过24小时；制度性约束：如晚上12点必须熄灯；信息约束：如你并知道这门课有什么价值；对他人行为的预期,确定环境下理性人行为的基本特征,最优选择由偏好和约束条件决定：人们选择的不同可能是由于偏好不同，也可能是由于面临的约束条件不同，如买车；最优选择在个人边际成本等于边际收益时达到；最优选择会随外生变量的变化而改变。,不确定环境下的最优选择,预期效用理论(expected utility theory) 期望效用理论（prospect t

11、heory),对理性人假设的批评,有限理性(bounded rationality):intended to be rational, but only limited to be so. Cognitive ability(limited computational skill and serious flawed memories) 有限毅力（bounded willpower)； Present-biased preference 有限自利（bounded self-interest) emotional behavoir,对理性人假设的捍卫,Second best: no reliab

12、ly accurate and analytically tractable theory of inconsistence and foolishness has been developed; Survival: peoples behavior is expected to more closely approximate the ideal rationality; Normative: functional goal of social science is not just to predict human behavior, but also to analyze social

13、institutions and evaluate proposals for institutional reform.,效率标准,问题：社会是由人组成的，每个人的行为都会影响到他人的利益。那么，我们用什么样的标准判断个人的行为是否正当？考虑两种情形：情形A：某店主雇人将竞争对手的店门堵上，使后者不能营业；情形B：某店主以更低的价格和更优良的服务将竞争对手打垮。这两种情形有什么不同？为什么法律允许第二种情形而不允许第一种情形？,帕累托效率,定义：一种状态（资源配置、社会制度等）被称为帕累托最优状态，如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好。简单的

14、说法是：对每个人来说，除非“损人”就不可能“利己”，社会就达到了帕累托最优状态。不同帕累托状态之间不可以比较所以，帕累托最优可能意味着收入分配的不公平；极端地，一个人得到所有收入，另一个人一无所有，也是一个帕累托最优,以两人社会为例,A的收入,B的收入,X,Y,Z,。,。,。,X和Y都是帕累托最优状态，但Z不是帕累托最优状态,帕累托改进与帕累托标准,定义：一种变革没有使任何人的处境变坏，至少有一个人的处境变好。如果一种状态不是帕累托最优，意味着存在帕累托改进的可能。如果社会已经处在帕累托最优状态，就不可能有帕累托改进的余地。状态X帕累托优于状态Y，如果在状态X下，至少有一个人的处境

15、比状态Y下更好，而没有任何人的处境比在状态Y下坏。,两人社会为例,A的收入,B的收入,。,Z,。,F,。,X,。,G,。,H,从Z到F、X是帕累托改进；从Z到H、G不是帕累托改进；从H、G到X、F、Z都不是帕累托改进,卡尔多-希克斯（Kaldor-Hicks）标准,设想：状态X下，A的收入是100，B的收入也是100；在状态Y下，A的收入是1000，B的收入是99。依帕累托标准，这两个状态是不可比较的：A在状态Y下更好，B在状态X下更好。卡尔多-希克斯标准：如果一种变革使得受益者的所得足以弥补受损者的所失，这种变革就是一个卡尔多-希克斯改进。如果补偿实际发生，就是帕累托改进。因此，“卡尔

16、多-希克斯标准”就是“财富最大化”。,举一个法律的例子：过失责任,杨颉等诉北京大华无线电仪器厂：杨颉、王磊、徐方略都是十三四岁的儿童，三人的爷爷和奶奶是邻居，居住在大华厂家属楼内。2000年10月2 日，三小孩相约各自携带火柴、爆竹、手电等一起玩耍。大华的厂区与宿舍区有围墙相隔，但是，该围墙有一缺口，人们可以轻易翻越。为了上班方便，人们经常从缺口处翻越行走。三小孩来到大华厂围墙外，从缺口处翻墙进入厂区内，并找到一个装有液体（三氯乙烷，危险品）的白色塑料桶，三人将桶盖拧开倒出液体，王磊用火柴将液体点燃，后王磊又将桶内液体全部倒在火上，使火势突然增大，并发出巨响，随即大火朴到杨颉身上，将其烧伤。（

17、王成，第122页）法院判决：大华厂承担责任 HAND 规则。,应用：交易效率,人们为什么交易：偏好不同；生产成本不同；信息不同；风险态度不同。自愿的交易一定是一个帕累托改进（假定没有欺诈）设想：A拥有10个苹果，0个桃；B拥有0个桃，10个苹果。如果边际效用是递减的，A用5个苹果换B的5个桃，对双方是一个帕累托改进；交易的结果：各有5个苹果和5个桃。,市场：供给与需求,数量,价格,需求曲线（消费者的评价）,供给曲线（生产者的成本）,均衡价格,均衡产量,为什么垄断是没有效率的,数量,价格,需求曲线（消费者的评价）,供给曲线（生产者的成本）,均衡价格,均衡价格,垄断价格,垄断产量

18、,应用：竞争规则,设想有一个商店。如果一个人使用暴力捣毁这个商店，然后在旁边办起自己的商店销售同样的东西，这种行为就构成犯罪。但如果这个人用较低的价格和更好的服务挤这个商店，他就无须为此承担责任。从该商店的所有者来看，结果是一样，但为什么法律的规则不一样呢？原因在于后一种情况下，社会的所得（包括消费者和新店的所有者）大于所失，是一个卡尔多-希克斯改进，而在前一种情况下，不如此。一般地，什么是所谓的社会允许甚至鼓励的“正当竞争”？答案是“卡尔多-希克斯标准”。,应用：生产效率,生产可行性边界,小麦,玉米,。,X,非效率点,应用：分工效率,如果两个人同时生产两样产品（面包和牛奶），每人的产量为

19、（50，50），总产量是（100，100）；如果A专业化于生产面包，产量可以达到150；B专业化于生产牛奶，产量可以达到140；那么，分工与不分工比较，就是一个帕累托改进，因为总产量可以达到（150，140）。绝对优势与比较优势。经济增长很大程度上来自分工效率。,应用：合作与组织,如果两个人在一起工作创造的价值大于独立工作创造的价值之和，合作就是一个帕累托改进；当只当组织的价值必须大于个人独立的价值之和时，组织是可能一个帕累托改进；当个人才组织中获得的价值大于独立获得的价值时，加入组织是一个帕累托改进；1+12 企业战略联盟：只有当联盟是一个帕累托改进时，联盟才会出现。,应用：企业重组

20、,以郑百文为例：到2000年6月30日止，郑百文的债务总额达23.46亿，其中对信达资产管理公司负债20.99亿；在郑百文的资产中，固定资产2.5亿，流动资产61686万（其中大部分是高风险的应收帐款）；郑百文的每股净资产为-6.81元，股东权益为-13.458亿。郑百文应该破产清算，还是进行资产重组？清算意味着着除债权人外，其他参与人的价值均为零；因此，只要债务人从重组得到的价值不低于预期可收回的债权，重组对所有参与人是一个帕累托改进。解雇员工能成为一个帕累托改进吗？,应用：社会改革,如果改革中没有人受损，至少有一些人受益，改革就是一个帕累托改进；如果改革使一部分人受益，另一部分人受

21、损，但受益者所得大于受损者所失，改革是一个卡儿多-希克斯改进，或者说，潜在的帕累托改进；如果受损者得到足够的补偿，就是一个帕累托改进；革命通常不是一个帕累托改进。,应用：婚姻家庭,自由结婚对夫妻双方是一个帕累托改进；买卖婚姻对买卖双方是一个帕累托改进；离婚不一定是一个帕累托改进；但如果提出离婚的一方愿意补偿另一方，使得对方同意离婚，离婚就是一个帕累托改进；所以，协议离婚是一个帕累托改进。但离婚对其他利益相关者（如父母和儿女）可能不是一个帕累托改进。以什么为比较基：第三者问题,李敖之女哭了,北京青年报2004年2月13日：为了邻居的狗叫鸡鸣、养花晒衣等，台湾著名作家李敖之女李文多次投诉邻

22、居，以致她和几家邻居的关系日渐紧张。2月10日，嘉浩园区的物业突然向李文发出“逐客令”，以李文给整个园区的生活造成极坏的影响为由，要求李文搬离小区，否则将遭到断水断电的处理。对此，李文流出委屈的泪水，并委托律师状告物业公司。李文说，这幢别墅是她以每月1300美元的租金租来的，租期是三年，从去年8月份开始她一直住在这儿。在别墅的二楼，李文指着某歌星的大院说，前段时间，三条大狼狗经常冲着大铁门狂叫，只要有人过来，大狼狗便不停地狂叫。接着她又指向右侧的一幢别墅说，他们家养了两只公鸡，每天5点左右就开始打鸣，吵得人无法正常休息。李文还说，有的邻居竟在院子内种植庄稼，因此招来了不少蚊虫；有的还将内衣挂在

23、外面晾晒，这种做法很让她受不了。,李敖之女哭了,李文说，为了维护自己的权益，她多次向小区的物业投诉，而小区的物业只是非常被动地接待她的投诉。无奈，她又多次找到几家邻居交涉，然而交涉的过程却非常艰难，为此还与邻居发生争吵。2月10日，小区的物业竟送来通知，要求她在一个星期内搬走，否则就将她所住的别墅断水断电。李文说，她只是想维护自己的权益，没想到物业竟然赶她走，而且她已经交纳了房屋的租金。说着李文已经泪流满面。当记者问及这些投诉是否挑剔时，李文说：“我感觉我不是那么挑剔，只是我的要求高一点，我的生活观念比人家高一点，只要有人侵犯到我的小范围，影响到我的生活了，我一定要投诉！”北京盟科置业有限公司

24、的总经理陈渊宇接受了记者的采访。陈总说，之所以发出这样的通知，完全是因为李文与邻居的关系太紧张，再就是李文根本听不进别人的意见。李文非常注重自己的权益，以至于到了苛刻的地步。邻居在家中养花、晾衣物她也认为侵犯了她的权益，并为此数次找到物业公司投诉、找到邻居理论。由于李文容易激动，所以从去年8月份她入住该小区以来，就一直与物业和周围邻居关系紧张。,外部性与科斯定理,个人收益与社会收益：一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益，如养花；个人成本与社会成本：社会成本等于决策者的个人承担的成本加社会其他成员承担的成本，如环境污染，交通堵塞；如果个人收益（/成本）不等于社会

25、收益，我们说存在外部性。,个人最优决策与社会最优,理性人的最优决策：边际个人成本等于边际个人收益；当然，目标函数很重要；社会最优决策（帕累托最优）：边际社会成本等于边际社会收益；因此，除非没有外部性，个人最优决策不等于社会最优决策。,图示说明：社会成本大于个人成本,产量,边际成本与边际收益,边际个人收益（等于边际社会收益）,边际个人成本,边际社会成本,个人最优产量,社会最优产量,边际外部成本,图示说明：社会收益大于个人收益,产量,边际成本与边际收益,边际个人收益,边际个人成本（等于边际社会成本）,个人最优产量,社会最优产量,边际社会收益,举例,环境污染；夜间施工；交通事故；

26、垄断定价；国有企业的恶性竞争；教育；,政府管制、皮古税与科斯定理,个人最优与社会最优的不一致意味着有帕累托改进的余地；核心是：如何将外部性内部化：如果有办法使得个人在边际上承担全部的社会成本和获得全部的社会收益，问题就解决了；传统的理论：政府管制或对个人征收皮古税（或补贴）；在负外部性的情况，征税和补贴代表不同的产权安排。,皮古税或补贴如何解决问题？,产量,边际成本与边际收益,边际个人收益（等于边际社会收益）,边际个人成本（无税情况）,边际社会成本（加税后的边际个人成本）,个人最优产量,社会最优产量,边际税率=边际外部成本,科斯定理,Coase（1960）：只要产权界定是清楚

27、的，如果没有交易成本，外部性可以通过当事人之间谈判解决，帕累托效率可以实现；并且，最终的资源配置与初始的产权安排无关。比如说：夜间唱歌,科斯定理图示,牧养人放牧的数量,牧羊的边际利润,农场主的边际净损失,社会最优量,P,S,O,说明,如果产权归农场主，农场主可以禁止放牧（点0），小于社会最优量S；但此时，增加放牧给牧羊人带来的边际利润大于给农场主造成的损失，牧羊人将有积极性贿赂农场主，直到放牧量达到S为止；如果产权归牧羊人，牧羊人的利润最大点是P，大于社会最优量S；但此时，减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本，所以，农场主将有积极性贿赂牧羊人，直到S；因此，无论初始

28、产权如何安排，双方谈判可以实现帕累托最优。科斯定理意味着：如果没有交易成本，公司治理结构（包括股权结构）是无关紧要的,交易成本与次优选择,定义：交易成本包括所有与交易有关的成本，包括发现交易对象的成本、谈判成本、签约成本、执行成本，以及所有可能的效率损失（与帕累托最优比）；交易成本存在的原因：交易者的数量（人越多，达成本协议越难）信息不对称（信息越不对称，谈判越难，合同的执行也越难）交易成本意味着：只有次优，没有最优；,作为激励机制的法律,法律通过责任的分配和赔偿/惩罚规则是实施，将个人行为的外部成本内部化，诱导个人选择社会最优的行动；如果个人之间签约的交易成本太高，法律可以节约交

29、易成本；以交通事故为例：司机开车可能伤害他人，但要每个司机与所有可能的受害人签定合同是不可能的，侵权赔偿替代了合同；但法律面临信息约束。,民法与刑法的不同,诉讼：民法是“民不告，官不纠”；刑法是“民不告，官也纠”（政府是公诉人）；责任程度：民法的赔偿基本上是补偿性的；刑法的处罚是惩罚性的；形式：民法的赔偿以货币形式为主；刑法的处罚以非货币形式为主（自由和说明）,民法与刑法的界线,侵权的外部性程度：受害人越多，越适合于刑法；惩罚的可性度：如果民事制裁不可信，就需要刑事制裁；复仇的可能性：如果私人复仇会导致伤害的不断升级，就需要用刑法替代民法。,纳什均衡与一致预期,张维迎教授北京大

30、学光华管理学院,博弈的基本概念（1）,参与人（players)：博弈中决策主体的集合：什么人参与博弈？每个人是什么角色？行动（actions): 每个人有些什么样行动可以选择？在什么时候行动？信息(information)：在博弈中的知识；每个人知道些什么（包括特征、行动等）？战略（strategies)：行动计划；每个人有什么战略可供选择？战略的完备性；,博弈的基本概念（2）,支付（payoffs)：每个人在不同战略组合下得到些什么？依赖于所有参与人的选择；均衡（equilibrium)：所有参与人最优战略的组合；结果（outcomes)：我们所感兴趣的东西。,静态博弈,最简单的博

31、弈：所有参与人同时选择行动，并且只选择一次； “同时”是一个信息概念，而不一定与日历上的时间一致；,囚徒困境（prisoners dilemma),囚徒困境,坦白,不坦白,坦白,不坦白,8，8,0，10,10，0,1，1,无论对方如何选择，每个人的最优选择：坦白。所以，我们可以预测，结果将是（坦白，坦白）,占优均衡 (dominant-strategy equilibrium),一般来说，由于每个参与人的效用依赖于所有人的选择，因此每个人的最优选择（战略）也依赖于所有其他人的选择（战略）。但在上述例子中，一个人的最优选择并不依赖于他人的选择。这样的最优战略，被称为“占优战略”(dominan

32、t strategy)。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。占优战略均衡的出现只要求所有人都是理性的，但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡，所以其结果很容易预测。,个人理性与集体理性的冲突,“囚徒困境”表明个人理性与集体理性的冲突。这样的例子很多：寡头竞争，军备竞赛，团队生产中的劳动供给，公共产品的供给，等等；许多的制度就是为解决“囚徒困境”而存在的；,公共产品（public goods),提供,不提供,提供,不提供,4，4,-1，5,5，-1,0，0,无论对方如何选择，每个人的最优选择：不提供。所以，我们可以预测，结果将是（不提供，不

33、提供）,公共产品与税收制度,比较私人产品与公共产品的不同：使用上排他性；私人产品是志愿购买的，但公共产品可能需要强制购买；税收制度就是保证公共产品的生产，解决公共产品生产上的“囚徒困境”,“囚徒困境”的一般表示,合作,不合作,合作,不合作,T，T,S，R,R，S,P，P,满足：RTPS; (S+R)T+T,用法律解决“囚徒困境”,合作,不合作,合作,不合作,T，T,S，R-X,R-X，S,P，P,满足：XR-T,“智猪博弈”(boxed pigs),有些博弈没有占优均衡，但通过剔除“坏”战略，我们可以预测博弈的结果。如“智猪博弈”,按,等待,按,等待,3，1,2，4,7，1,0，0,这个博

34、弈中，大猪的最优选择依赖于小猪的选择，但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的，大猪将选择“按”。均衡是“大猪按，小猪等待”。 “劣”战略：无论对方选择什么，如果自己选择A得到的总是收益小于选择 B得到的收益，A就是相对于B的劣战略。,重复剔除占优均衡,“重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路：首先找出博弈参与人的劣战略(dominated strategy)（假定存在的话），把这个劣战略剔除后，剩下的是一个不包含已剔除劣战略的新的博弈；然后在剔除这个新的博弈中的劣战略；

35、继续这个过程，直到没有劣战略存在。如果剩下的战略组合是唯一的，这个唯一的战略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。如果这样的解存在，我们说该博弈是“重复剔除占优可解的”(iterated dominance solvable).,理性共识（common knowledge of rationality),(1)Zero-order CKR: 每个人都是理性的，但不知道其他人是否是理性的； (2)first-order CKR: 每个人是理性的，并且知道其他每个人也都是理性的，但并不知道其他人是否知道自己是理性的； (3)second-

36、order CKR: (1)+(2)+每个人知道（2） nth-order CKR: R(b)C(b)R(b)C(b)R is rational,重复剔除与理性共识,重复剔除不仅要求每个人是理性的，而且要求每个人知道其他人是理性的，每个人知道每个人知道每个人是理性的，如此等等，即理性是“共同知识”（共识）,C1,C2,C3,R1,R2,R3,10,4,1, 5,98,4,9, 9,0, 3,99,8,1,98,0,100,100,98,这个博弈只要求一阶理性共识就可以预测均衡结果。如果把（下左）的第一个数字改为 11呢？,最优选择,这个博弈只要求一阶理性共识就可以预测均衡结果：如果

37、R相信C是理性的，R就知道C不会选择C3，所以R的最优选择是R1；如果C相信R是理性的，C就知道R不会选择R2，所以C的最优选择是C2。但要C预期R不会选择R3，需要二阶理性共识；要R不预期C会选择C1，需要三阶理性共识。,R排除C选择C1,R believes C believes R believes C is rational,(C1,C2),R1,C2,好事变坏事？,在单人决策中，个人给定选择在所有情况下的收益都增加，一个人的状况不会变得更坏，但博弈中则不同。,上,下,左,右,上,下,左,右,-1, 3,2, 1,0, 2,3, 4,1, 3,4, 1,0, 2,3, 4,选择越多

38、，对理性共识的要求越高,R1,R2,R3,R4,C1,C2,C3,C4,5，10,0，11,1，20,10，10,4，0,1，1,2，0,20，0,3，2,0，4,4，3,50，1,2，93,0，92,0，91,100，90,(1)Zero-order CKR: C not choose C4 for C is rational (2)1st-order CKR: R not choose R4 for R (b) C (3)2nd-order CKR: C not choose C1 for C(b)R(b)C (4)3rd-order CKR: R not choose R1 for R(

39、b)C(b)R(b)C (5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C (6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)C so, (R2,C2) is an equilibrium,不能用重复剔除解的博弈,许多博弈没有占优均衡，也没有重复剔除的占优均衡。考虑如下博弈：,C1,C2,C3,R1,R2,R3,0，4,4，0,5，3,4，0,0，4,5，3,3，5,3，5,6，6,可理性化的选择,Rationalizable strategy: 不能被重复剔除的

40、战略；或者说，可以被合理的信念(belief)所支持的行为；例如：R理性化选择R1：如果R(b)C 选择C2，如果R（b）C（b）R会选择R2；如果R（b）C（b）R（b）C会选择C1；如果R（b）C（b）R（b）C（b）R会选择R1,Consistently aligned beliefs (CAB),考虑（R3，C3）：对方不会犯预期错误：R选择R3，如果他认为C会选择C3；C会选择C3，如果他认为R会选择R3。 CAB：每个人对别人行为的预期（信念）是正确的； Harsanyi doctrine: 如果两个理性的人具有相同的信息，他们一定会得出相同的推断和相同的结论; Robe

41、rt Aumann: rational agents cannot agree to disagree.,纳什均衡与一致预期,纳什均衡：所有参与人的最优战略的组合：给定该战略中别人的选择，没有人有积极性改变自己的选择。一致预期：基于信念的选择是合理的；支持选择的信念是正确的；预期的自我实现：如何所有人认为这个结果会出现，这个结果就会出现。预期是自我实现的，预期不会错误。如果你认为我预期你将选择X，你就真的会选择X。,哲学思考,如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。,寻找纳什均衡,C1,C2,C3,R1,R2,R3,100，

42、100,0，0,50，101,50，0,1，1,60，0,0，300,0，0,200，200,纳什均衡：举例,广告博弈纳什均衡：（做广告，做广告）,企业1,企业2,利用纳什均衡寻租,考虑股票市场融资的例子：设想企业价值是100，现在发行的流通股为100股，每股价值1元。现在假定经理想筹集100元，投资价值只有50元。有人买新股吗？假定每一股配4股，价格为0.25元。如果股东不接受配股：原来一股1元的价值就变成0.3元（=150/500）；如果接受配股，他持有的股票的价值是1.5元；因为配股的成本是1元，所以他的最优选择是接受配股。,所有权配置与等级结构,考虑团队生产：让其中的一个人变成所有者

43、,工作,偷懒,工作,偷懒,6，6,2，2,0，8,8，0,纳什均衡与学习过程,R2,R1,NE,q1,q2,双寡头竞争：Cournot博弈,两个企业同时选择产量，价格由市场决定；假定需求函数为其中为企业1的产量，为企业2的产量假定成本函数为：那么，利润函数为：,双寡头竞争（续）,企业最大化利润的一阶条件为：纳什均衡产量：纳什均衡利润为,垄断产量和垄断利润,垄断企业的目标函数：垄断产量：垄断利润：,划拳博弈,老虎,鸡,虫,杠子,老虎,鸡,虫,杠子,0，0,1，-1,0，0,-1，1,-1，1,0，0,1，-1,0，0,0，0,-1，1,0，0,1，-1,1，-1,0，0,-1，1,0，

44、0,混合战略纳什均衡,有些博弈没有“纯战略”纳什均衡，但有混合战略纳什均衡，如监督博弈。,监督,不监督,偷懒,不偷懒,1，1,1，2,2，3,2，2,给定工人偷懒，老板的最优选择是监督；给定老板监督，工人的最优选择是不偷懒；给定工人不偷懒，老板的最优选择是不监督；给定老板不监督，工人的最优选择是偷懒；如此循环。,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡（纯战略或混合战略）；如果一个博弈存在两个纯战略纳什均衡，那么，一定存在第三个混合战略纳什均衡。,风险与均衡,由于纳什均衡要求理性共识和一致预期，当人们可能犯小小的错误时，纳什均衡不一定被选择。如下面这个博弈中，多数

45、人将选择“下”而不是“上”。,上,下,左,右,8, 10,-1000,9,7, 6,6, 5,只要B有千分之一的概念错误地选择右， A将选择下；如果B怀疑 A怀疑自己可能犯错误， B将选择右。所以，出现的不是纳什均衡,有问题的纳什均衡？,C1,C2,C3,R1,R2,R3,2，2,3，1,0，2,1，3,2，2,3，2,2，0,2，3,2，2,第三章多重均衡与制度和文化,张维迎北京大学光华管理学院,实验：选数博弈,规则：有两个人，110十个数字，每个人可以选择其中的任意五个；如果两个人的选择没有重复，每人得到50元；否则，各为0。,多重纳什均衡：产品标准,许多博弈可能有多个纳什均衡,3

46、.5“,5.5“,3.5“,5.5“,8, 8,3, 2,2, 3,6, 6,这个博弈被称为 “协调博弈”：有两个纯战略纳什均衡，一个混合战略均衡。哪一个将出现呢？,交通博弈,靠左行,靠右行,靠左行,靠右行,1，1,1，1,-1，-1,-1，-1,约会博弈,芭蕾舞,足球场,芭蕾舞,足球场,1，2,0，0,0，0,2，1,进门博弈,先进,后进,先进,后进,-1，-1,-1，-1,2，1,1，2,分蛋糕博弈,x1,x2,1,1,任何满足x1+x2=1的点都是纳什均衡。,资源争夺博弈（chicken),Hawk,Dove,Hawk,Dove,-1，-1,5，5,10，0,0，10,如何协调？

47、,仅仅“理性”是不够的； FOCAL POINT（PROMINENCE）：Schelling（1960）；帕累托最优均衡：可以通过协商选择一个纳什均衡；cheap talking；文化与制度行业组织；,帕累托最优均衡,3.5“,5.5“,3.5“,5.5“,8, 8,3, 2,2, 3,6, 6,（3.5“,3.5”) 帕累托优于(5.5“,5.5”),Cheap talk 可以帮助协调到一个帕累托最优均衡,为什么要相信？,C1,C2,R1,R2,9，9,0，8,8，0,7，7,不论C选择什么，他都有积极性告诉R他将选择C1；所以没有理由认为R应该相信C的话。,R,C,锁定效应与路

48、径依赖,如果博弈参与人很多，达成协议的成本很高，最初的非帕累托均衡可以被锁定（lock-in), 导致路径依赖（path dependence)：每个人多偏好于新产品（或标准），如果其他人都选择新产品的话；但由于每个人都预期其他人不会选择新产品，所以每个人的最优选择是不转向新产品，结果是整个社会被锁定在现有的产品（标准）（非帕累托最优）；这常被用来作为市场失灵的理论证据；经验证据：QWERT vs Dvorak键盘；Beta vs VHS录象机；MAC与IBM计算机软件；但最新的研究似乎正在推翻这些广泛流行的结论。,键盘的寓言,1868年Christopher L. Stoles发明QW

49、ERT键盘；由Remington公司生产； 1936年Dvorak发明简化键盘（DSK，Dvorak Simplified Keyboard):认为这一键盘通过平衡双手和更有力的手指之间的工作量，极大地减少了打字产生的手指运动，其优势在于提高速度、减少疲劳，以及更容易的学习。为什么没有被采用？最初的打字员不选择学习Dvorak，因为Dvorak机器很难找到；办公室不原配置Dvorak，因为找不到打字员；但这些说服并不成立：（1）支持Dvorak更好的论点证据不足，许多是猜测；（2）人体过程学方面的研究发现，它没有任何在科学上可靠、重要的优势；（3）打字机市场上的竞争要比通常报告的要激烈的多

50、；（4）其他许多比赛证明其他键盘的优越性。,VHS 与Betamax,Sony公司1975年开始销售Betamax,并把一再把该技术提供给松下、JVC； 1976年4月三家公司最终同意召开一次会议来比较Betamax，VHS和VX；但由于JVC的侵权，SONY和松下-JVC分道扬镳； SONY相信“小”，松下相信“长”； SONY吸引东芝和三洋支持Beta，松下则把日立、夏普和三菱拉入阵营；一种制式的任何改进都伴随着另一阵营的相同改进；一方降价，另一方也跟进。两中制式在几乎所有方面都被证明是完全相同的，除了一方面：VHS播放时间更长，Beta两小时，VHS 4小时；Beta5小时，VHS 8小时。市场在播放时间和磁带压缩之间的投票是决定性的：1979年前，VHS在美国的销售是Beta的三倍，1983年前，Beta的在世界市场份额的份额下降到12%；1984年，只有SONY在生产Beta。,

展开阅读全文