博弈论已经改.ppt-道客多多_道客多多docduoduo.com

资源描述

1、纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡（纯战略或混合战略）；如果一个博弈存在两个纯战略纳什均衡，那么，一定存在第三个混合战略纳什均衡。,2.3.1 古诺的寡头模型,1古诺（Cournot)的寡头模型设市场上存在1，2两家厂商，生产同样的产品，厂商1的产量是q1,厂商2的产量是q2, 总产量 Q=q1+q2。设市场出清价格P是市场总产量的函数P=P(Q)=8-Q,假设厂商都无固定成本，且每增加一单位的边际成本相等，c1=c2=2,分别为2q1和2q2，他们在做决策时都不知道另一方的产量。显然：u1=q1*P(Q)-c1* q1 =q1(8-(q1+q2)-2q1u2=q2

2、*P(Q)-c2* q2 =q2(8-(q1+q2)-2q2,求极值得到：则市场总产量是：4市场价格是：4双方各自得益是：两厂商的利润总和是：8,求得：总得益是：9 各自生产一半：1.5 各自分到的利益是：4.5 则：不突破突破,添上数,厂商1,不突破1.5,突破2,厂商2,不突破1.5,突破2,2.2.1 纳什均衡定义 P68,策略空间：博弈方的第个策略：博弈方的得益：博弈：纳什均衡：在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合的最佳对策，也即对任意都成立，则称为的一个纳什均衡,博弈论就是系统研究可以

3、用上述方法定义的各种博弈问题，寻求在各博弈方具有充分理性或者有限理性、能力下，合理的策略选择和合理选择时的博弈的结果，并分析这些结果的经济意义、效率意义的理论和方法。,“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单地说，“囚徒的困境”问题都是个体理性与集体理性矛盾引起的。现实中“囚徒的困境”类型的问题是很多的。例如厂商之间的价格战、恶性的广告竞争，初等、中等教育中的应试教育等，其实都是“囚徒的困境”博弈的表现形式。,小偷和守卫的博弈,例：守卫VS小偷演绎博弈论19

4、94年经济学诺贝尔奖得主塞尔顿，在 1996年上海的一次讲演.一小偷欲偷窃有一守卫看守的仓库，如果小偷偷窃时看守在睡觉，则小偷就能得手，偷得价值为V的赃物；如果小偷偷窃时守卫没有睡觉，则小偷就会被抓。设小偷被抓住后要坐牢，负效用为-P，守卫睡觉而未遭偷窃有S的正效用，因睡觉被窃要被解雇，其负效用为-D。而如果小偷不偷，则它们既无得也无失，守卫不睡意味着出一份力挣一份钱，他也没有得失。(V,D均大于0),博弈矩阵是,守卫睡觉不睡觉偷小偷不偷,假设小偷偷窃守、卫睡觉的概率分别为、守卫睡的期望是：小偷偷的期望是：解释如下：如果小偷不偷，守卫可以概率 P/(V+P)睡觉，或者守卫不睡，小偷以

5、概率 = S/(D+S）偷窃，都是纳什均衡。,小偷的混合策略,S到-D连线的纵坐标是在横坐标对应的小偷“偷”窃概率下的守卫选择“睡”的期望得益，即S(1- )+(-D) ,加重对守卫的处罚在短期中的效果是使守卫真正尽职，但在长期中恰恰是会降低盗窃发生的概率（激励的悖论）,守卫的混合策略,小偷的混合策略分布不受P的影响，因此政府加重对小偷的惩罚在长期中并不能抑制盗窃，最多只能抑制短期的盗窃发生率，它的作用主要是使守卫可以更多地偷懒,上面的概率函数揭示这样一个出乎意外的现象，降低小偷偷窃的概率，可以通过加大对守卫的处罚值D（守卫如果想多睡觉，必须加大对小偷的处罚力度P，原理相同）。这样的结果可以通

6、过绘制概率支付函数图像得出，也比较好解释，守卫处罚加重，不睡觉概率增大，小偷不敢来偷，偷窃概率降低。,帕累托上策均衡,（鹰鸽博弈）这个博弈中有两个纯策略纳什均衡，（战争，战争）和（和平，和平），显然后者帕累托优于前者，所以，（和平，和平）是本博弈的一个帕累托上策均衡。,2、风险上策均衡：猎鹿博弈,设想村庄里只有两个猎人，主要猎物只有两种：鹿和兔子。如果两个猎人齐心合力，忠实地守着自己的岗位，他们就可以共同捕得一头鹿。要是两个猎人各自行动，仅凭一个人的力量，是无法捕到鹿的，但却可以抓住4只兔子。从能够填饱肚子的角度来看，4只兔子可以供一个人吃4天；,1只鹿如果被抓住将被两个猎人平分，

7、可供每人吃10天。也就是说，对于两位猎人，他们的行为决策就成为这样的博弈形式：要么分别打免子，每人得4；要么合作，每人得10（平分鹿之后的所得）。如果一个去抓兔子，另一个去打鹿，则前者收益为4，而后者只能是一无所获，收益为0.在这个博亦中，要么两人分别打名兔子，每人吃饱4天；要么大家合作，每人吃饱10天，这就是这个博亦两个可能结局。,乙,猎鹿,猎兔,甲,猎鹿,猎兔,猎鹿博弈：,问题：找出经济生活中可以用帕累托上策均衡、风险上策均衡分析的例子帕累托上策均衡通常在分析存在多重纳什均衡，不同纳什均衡之间有优劣关系的博弈问题时有用，因此适合用来讨论现实中我常说的共赢、多赢可能性或者条件等。例如两个企

8、业之间的技术、投资合作，劳资关系，或者两个国家之间政治、军事和外交冲突等都可以用帕累托上策均衡概念进行分析。风险上策均衡通常是在有一定的不确定性，而且不确定性的主要来源于客观因素、环境因素的博弈问题，例如人们对就业和职业的选择，人们在银行存款和股市之间的选择，以及投资和产品、技术开发方面的决策等问题都可以用风险上策均衡概念进行分析。,需要指出的是，同一个委托代理关系可以存在多种的信息不对称属性,如雇主知道雇员的能力但不知其努力水平时，是一个隐藏行动的道德风险问题；但若雇主和雇员本人在签约时都不知道雇员的能力，但雇员本人在签约后发现了自己的能力（雇主仍不知），则问题就是一个隐藏信息的道德风险

9、问题。若雇员开始就知道自己的能力而雇主不知，则是逆向选择问题，若雇员开始就知道自己的能力而雇主不知且若雇员在签约前就获得学历证书，则问题就是信号传递问题。相反，若雇员是在签约后根据工资合同的要求去接受教育，则问题就是信息甄别问题。,三国演义中的空城计与信息不对称的博弈,问题的关键在于：司马懿不知道自己和对方在不同行动策略下的支付，而诸葛亮是知道的，他们对博弈结构的了解是不对称的。诸葛亮拥有比司马懿更多的信息，他知道自己兵力微薄，但是司马懿并不知道。而且，为了让司马懿无从了解、判断，诸葛亮还偃旗息鼓，大开城门，打起了心理战。因此这是一个信息不对称的博弈。在这里，孔明可以选择的策略是，“弃城

10、”或“守城”。无论是“弃”还是“守”，只要司马懿明确知道他自己的支付，那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。,例：空城计诸葛亮、司马懿的博弈新解为什么司马懿不派出一个小分队搞火力侦察，探明虚实再作决断,“空城计”只是虚构的故事，不太可能在现实里发生。你可能会想：如果换了我，尽管可能没有司马懿那么聪明，可还是能够活捉孔明。我们可以设想，其实司马懿完全可以派出一个小分队搞火力侦察，探明虚实再作决断。这样即使孔明真的设下了埋伏，他的损失也不大；如果没有埋伏，就可以进攻活捉孔明。,胆小鬼博弈：,乙不让让不让甲让两强相遇，勇者胜,不完全信息的静态博弈：贝叶斯纳什均衡,求爱博弈：如何结束单身生活,例：胆小鬼博弈的风险,司机乙让不让让司机甲不让,假设司机乙以概率q选择让，则q一定使司机甲的“让”和“不让”策略的期望得益相等，即：司机乙以概率选择“让”以概率选择“不让” 记为混合策略：,同理，司机甲选择“让”的概率为：司机甲的混合策略记为：混合策略均衡记为：司机乙司机甲,让,不让,让,不让,

展开阅读全文