1、7 进化博弈论 Evolutionary Game Theory,1,主要内容,进化稳定策略 进化稳定和纳什均衡间的关系 进化稳定混合策略,2,互动产生适应,3,例子:体态大小博弈 考虑一个甲虫群体。假设每只甲虫的生存状况主要取决于它能否发现食物及有效地汲取营养。 假设该种群的食物争夺总是表现为一对对甲虫之间的互动 当争夺食物的两只甲虫大小相同时,它们会平分同样的食物 当一只大甲虫和一只小甲虫争夺食物时,大甲虫会得到大多数的食物 在所有情形,给定食物的数量,大甲虫在生存适应能力上得到的益处要少,因为所得到的食物中有一部分要转化用来维持它们高耗的新陈代谢,例子:体态大小博弈,4,但是在这个博弈中
2、,每只甲虫都是由遗传基因硬性决定采取这两个策略之一。因此,对应基于策略选择相对利益的纳什均衡思想,我们将需考虑在较长时间尺度上策略的变化。在进化的力量下,那些变化通过种群规模体现。,进化稳定策略,5,我们称一个给定的策略是进化稳定的,若当整个种群都采取这个策略时,任何采取不同策略的小规模入侵群体在经过多代遗传后会最终消亡。 种群里一个生物体的适应性是指它和种群中一个随机相遇的生物体互动得到的预期收益。 策略T以x占比入侵策略S,指的是在总体中有x占比的生物体采用策略T,1-x占比采用策略S,其中x是一个小于1的正数。 最后,假设存在一个正数y,当任何其他策略T以任何xy程度入侵S时,采用策略S
3、的个体的适应性严格高于采用策略T的个体,则称策略S是进化稳定的。,体态大小博弈的进化稳定策略,6,体态大小博弈的进化稳定策略,7,体态博弈中进化稳定策略的解释,若有一小股大甲虫被引进到全部由小甲虫构成的种群中,由于大甲虫彼此争夺食物的概率非常小,几乎每次争夺食物它们都会得到大多数,小甲虫种群没有能力驱赶大甲虫,所以小体态策略不是进化稳定的。 相反,在主要有大甲虫构成的种群中,一小股小甲虫几乎在每次食物争夺中都会失败,所以大体态策略是进化稳定的。 但是,种群中小甲虫的适应性指数(5)要高于大甲虫的适应性(3)。因此,若始于小甲虫种群,物竞天择的结果是造成生物体适应能力的下降。,8,进化性军备竞赛
4、,9,例子:病毒族群的进化博弈 一个称为噬菌体6的病毒具有一种基因变异体称为噬菌体H2。 H2自身繁殖能力不强,但能够利用6的化学产物得到大大提高。,进化稳定策略的一般描述,10,进化稳定策略的一般描述,11,进化稳定与纳什均衡间的关系,12,若(S,S)是一个纳什均衡,则ac。因此,若策略S是进化稳定的,则(S,S)是一个纳什均衡,反过来的结论并不成立。,例子:猎鹿博弈,13,猎鹿博弈新版本:独立猎兔的额外收益,进化稳定混合策略,14,例子:鹰鸽博弈,鹰鸽博弈有两个理论上的纳什均衡:(D,H)和(H,D),在进化博弈论中定义混合策略,15,鹰鸽博弈中的进化稳定混合策略,16,任一进化稳定混合
5、策略一定对应一个混合纳什均衡。因此,首先寻找出鹰鸽博弈中的混合纳什均衡,接着检查这些混合纳什均衡是否是进化稳定的。 (1/3, 1/3)是一个混合纳什均衡,需要判断p=1/3是否是进化稳定 对于所有的q,都有V(p, p)=V(q, p),因此需要检验的不等式变为V(p, q) V(q, q),鹰鸽博弈中的进化稳定混合策略,17,当p=1/3时, V(p,q)=1/3q3+1/3(1-q)1+2/3q5=4q+1/3 V(q,q)=q3+q(1-q)1+(1-q)q5=6q-3q V(p,q)-V(q,q)=3q-2q+1/3=1/3(3q-1)只要q1/3,差值都是个正数。即只要qp,都有V
6、(p,q)V(q,q)。 这正意味着p事实上是个进化稳定混合策略,进化稳定混合策略的解释,18,在鹰鸽博弈中,我们看到的混合均衡是一种典型的生物环境中的混合均衡类型,其中,当总是采用一种行为无法持续进化时,生物体一定会打破两种不同行为之间的对称。 两种可能方式解释: 第一种:总体中所有参与方,实际上都可能会以一定的概率混合了两种以上的纯策略。 第二种:可能是总体中1/3的动物根据遗传基因选择了策略D,而2/3的动物选择了策略H。,重新定义偏好策略性偏好,借鉴了生态学家的方法:认为人类的嗜好不是任意给定的,而是在其生存环境中由于自然选择的压力而形成的。策略性偏好(strategic prefer
7、ence):并不是外生的、给定的,而是由于人类在社会生活中的相互作用而形成的。,三、偏好的演进,策略性偏好例证欺骗问题,三、行为经济学的扩展(一),在合作的商业风险中,每个人的表现有两种方式: “合作者(Cooperators)”和“背叛者(Defectors) 其报酬类似于囚徒困境,1、合作者和背叛者无法区分,同一组的两个人的组合是随机的。预期的报酬取决于组合的可能性,也就是总体中合作者的比重。以c表示总体中合作者的比重 每个合作者的预期平均报酬为: PC=4c+(1-c)0=4c 每个背叛者的预期平均报酬为:PD=6c+2(1-c)=4c+2。,三、行为经济学的扩展(一),这个例子提供了自
8、利模型以自我为中心假设的基本原理。,总体会如何随时间演化呢?由于背叛者总是得到较高的平均报酬,他们在人群中的比例会随时间增长。 而合作者,即使他们在一开始在人群中占有较高的比例,最终也只能消失。,2、合作者和背叛者很容易区分,合作者不会与背叛者合作。背叛者只能彼此合作。 由于所有的机会因素都在该互动过程中被排除,报酬不再取决于合作者在人口中的比例。 合作者总是得到4,背叛者总是得到2。,合作者的更大报酬促成了其成员的增加。 他们在总体中的比例越来越大。 当合作者可以被很容易的分辨出来的时候,面临灭绝的是背叛者。,心理学依据,面部肌肉运动的复杂结合,很难按需求产生,是当经历特定情绪时自然出现的。
9、 姿势和身体语言的其它因素、声音的程度和音色、呼吸的频率,甚至讲话的节奏都与潜在的动机行为状况系统相关。因为相关的联系超出大多数人的有意识的控制,所以要在别人面前把正在经历的情绪隐藏起来是困难的,假装表现出反映其它情绪的表情同样是困难的。 由于这个原因,我们可以运用这个线索形成对其他人的情绪的估计,这又反过来帮助我们形成对他们的偏好的估计。,面相识人有道理,据英国每日邮报报道,近日,英国一份新的研究报告称,成功人士都拥有相似面相。这份报告是基于全英富贾权贵面部特征研究得出的。报告称,成功男士都拥有古罗马式的鼻子、鼻翼宽、眼距宽;而成功女性则有较长的人中,高额头,舒展的眉形。研究对象包括英超切尔
10、西老板、石油巨头罗曼阿布拉莫维奇,印度钢王拉克西米米塔尔(Lakshmi Mittal),威斯敏斯特公爵,喜力啤酒继承人夏琳卡瓦柳(Charlene Carvalho)等。英国一家职业网站市场部主任马克莱利(Mark Riley)表示,“商业上的成功基于很多因素,其中之一可能就是面部特征。”,26,3、不完美模仿和警戒成本,背叛者的基因突变:变异的背叛者和非变异的背叛者 若背叛者可以完全地模仿合作者的特征而不需要成本也没有延迟 可以区分,1个单位的警戒成本 合作者会不会付出警戒成本? 付出,报酬是3; 不付出,报酬依赖于概率:4或0。 “无亏损点(breakeven)” :c=0.75。,会有
11、一种压力将总体推向合作者和背叛者的某种稳定的混合。两组成员都有相同的平均报酬因此存活下来的可能性也相同。生态龛位(ecological niche)。这个结果与只有机会主义者可以在激烈竞争的物质世界中存活下来的观点是截然相反的。,偏好假设的重要性,稳定的环境龛位(environmental niche):不仅为自利主义者,也为利他主义者。人们的偏好不仅可以不同,而且必须不同。,四、鹰鸽博弈的进一步研究,俄罗斯科学家伯特瑟夫和特琴用计算机程序设计了一个二维人造世界。 这个世界由一个个格子组成,每个格子相当于一块小领地,会时不时地冒出食物,能被在那个格子里的生物吃掉。 生物除了吃,还能休息,走到隔
12、壁的格子,对进入格子的其他生物进行攻击,以及像细菌那样用一分为二的方式繁殖。这些活动都要耗费一定的能量,休息耗能最少,攻击耗能最大。体内能量可以通过进食来补充,攻击时受害者也会输掉一部分能量转移给攻击者。如果体内能量用完也就死了。 后代遗传了亲代的特点,但也能发生变异。,4、“资产派”策略,“如果我是领地主人,就当鹰派;如果是入侵者,就当鸽派”的“资产派”策略。 我们很容易发现,大家都当资产派,才是最好的策略。 假如突变出了一只鹰派,虽然在它是主人而资产派是入侵者时可以轻易获胜,但是在它入侵资产派的领地时却要发生激烈的搏斗,付出较大成本,两项比较,还是不如也当资产派。 假如突变出了一只鸽派呢?
13、在它是入侵者时只能逃跑,而在它是主人时却要和入侵的资产派和平共处,还是不如也当资产派。 这就是为什么动物们普遍采用资产派策略。,出现了三种策略:从不攻击别的成员、受到攻击就跑的鸽派;靠四处攻击别的成员为生的鹰派;留在自己的格子里不去攻击邻居,但是一发现入侵者就立即攻击的资产派。不出所料,资产派占了大多数。 不过,资产派的出现有个条件:一个格子里的资源要足以支持一个定居者,这样资产派才能安分守己地待在自己的领地。如果资源太少,养不活资产派,就逼着大家去当鹰派或鸽派。,如果亲戚遗传了相同的标记,并能够辨认标记分清敌我,情形就截然不同了。这时除了各自谋生的自私成员之外,还会进化出合作成员,采取三种合
14、作策略。 一种是合作鸽派,它们不理睬外人,但是会把格子让给亲戚,自己出走避免竞争。 一种是合作鹰派,它们同样会把格子让给亲戚,但是一发现外人就会攻击。研究者把它们称为“鸦派”,因为俄国有句谚语:“乌鸦不啄其他乌鸦的眼睛。”鸦派是从鹰派和走资派变来的。还有一种是全新的门派。 亲戚们在同一个格子里生活,并共同对付入侵者。这种行为和椋鸟等能共同抵御外侮的椋鸟相似,因此研究者称它们为“椋鸟派”。,合作策略与资源,合作策略的出现,和资源的多少有很大的关系。 当每个格子的资源不足以维持两个成员时,鸦派占了优势,它们的比例很稳定。 但是在资源比较丰富时,椋鸟派的数量会逐渐上升,但是其他两派也都设法生存了下来。 如果每个格子的资源太少,少到不足以维持一个成员,又会出现一个新门派,它们比鸽派还超脱,一看有人进入它所在的格子,不管是敌是友,有没有受到攻击,自己都马上出走。它们恰好与资产派相反,是无产派。如果一个椋鸟派成员的体能下降到一定程度,它就离家出走,宁愿去和外人拼命抢资源而死去,也不愿留下耗费家乡的资源。它们被研究者称为亡命徒,不过更像是壮士。,生活中的资源与人的竞争策略 上地铁要挤,为什么上飞机还要挤? 等级社会最大的问题就是人为的制造稀缺资源,造成“竞争”成为每一个人无处不在的策略!,35,Q & A,36,