1、博弈论与策略选择,黄泉星 22911011, ,行政办公楼五楼 教材:决策中的博弈论,北京大学出版社,博弈包含四个方面,博弈的参加者(Player)博弈方 各博弈方各自可选择的全部策略(Strategies)或行为(Actions) 进行博弈的次序(Order) 博弈方的得益(Payoffs),博弈的分类,非合作博弈和合作博弈 非合作博弈范围内:完全理性博弈和有限理性博弈 静态博弈,动态博弈,重复博弈 零和博弈和非零和博弈,单人博弈和多人博弈 完全信息静态博弈和不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈,第二讲,完全信息静态博弈 基本分析思路,完全
2、信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益 静态博弈:所有博弈方同时或可看作同时选择策略的博弈 完全信息静态博弈:各博弈方同时决策,并且所有博弈方对各方在各种情况下的得益都了解的博弈。(非合作博弈基本类型)田忌赛马,猜硬币,古诺模型,投标活动,锤子剪刀布,2.1.1 上策均衡,上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略。(最优策略)囚徒的困境中的“坦白”;双寡头削价中“低价”。 一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。这样的策略组合被称为该博弈的上策均衡。 上策均衡是
3、反映了所有博弈方的绝对偏好,因此非常稳定。根据上策均衡,就可以对博弈结果作出最肯定的预测。,因此,进行博弈分析时,应首先判断各个博弈方是否都有上策,博弈中是否存在上策均衡。 上策均衡分析采用的决策思路是一种选择法的思路,是在所有可选择策略中选出最好的一种的思路。 因为博弈方的最优策略随其他博弈方的策略而变化是博弈的根本特征,是博弈关系相互依存性的主要表现形式,所以上策均衡不是普遍存在的。田忌赛马、古诺模型,锤子剪刀布,2.1.2 严格下策反复消去法,人们在决策活动中所运用的决策思路除了选择外,还有许多,例如排除法。 排除法通过对可选策略的相互比较,把不可能采用的较差策略(劣策略、下策)排除掉,
4、从而筛选出较好的策略或者缩小候选策略的范围。 严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,某个策略给一个博弈方带来的收益总是比另一种策略给他带来的收益小。则前一策略为相对后一策略的一个“严格下策”。 显然有,理性博弈方不会采用严格下策。,在任何博弈中,只要我们发现哪个博弈方的某些策略是相对于他的其它策略的严格下策,我们可以把它消去。 严格下策消去法既可在同一博弈方的策略空间中反复应用,也可以在各个博弈方的策略空间上交叉运用。 应用:,1,3,中,上,一个博弈方的不同策略之间,往往不存在绝对的优劣关系,而只存在相对的、有条件的优劣关系。在许多博弈问题中,严格下策往往不存在,例如各
5、种赌胜博弈。 因此,严格下策消去法也不能解决所有博弈的分析问题。 但它能使不少博弈问题得到简化,并且与其它重要的博弈分析概念和方法有着密切的联系。 它是博弈分析的标准工具之一。,2.1.3 划线法,博弈方的最终目标都是实现自身的最大得益。在具有策略和利益相互依存的博弈问题中,各个博弈方的得益既取决于自己选择策略,还与其他博弈方选择的策略有关。 因此,博弈方在决策时应考虑其他博弈方的存在和策略选择。 划线:先找出自己针对其它博弈方每种策略的最佳策略,在这一策略的得益下划线。,许多博弈不存在确定性的结果,2.1.4 箭头法,对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方能否通过单独改变
6、自己的策略而增加得益。 能,则从所分析的策略组合一箭头到改变策略后策略组合。,这种通过各博弈方选择倾向的箭头,寻找博弈中具有稳定性的策略组合的方法,就称为箭头法。 箭头法和划线法都是基于策略之间相对优劣关系进行分析的,可以相互替代。,课堂作业,博弈方2,博弈方1,博弈方2,博弈方1,博弈方2,博弈方1,在这里,严格下策不存在。,本课程成绩评定规则:,一篇课程大作业,提交得50分,评级为A加20分,B加15分,C加10分 平时作业6次,每次提交得3分,做对得5分 每旷课1次扣20分,迟到1次扣5分 课堂作业,视完成情况加分 课堂游戏,每次按游戏规则加减分 作业都完成,且不迟到,不旷课,则最低分为
7、50+1868,策略选择实例,每旷课1次扣20分,迟到1次扣5分 一位同学午睡过头了,两个策略:旷课、迟到。 选择迟到,得益为-5 选择旷课,则两种情况:抽点到,未被抽点到,得益分别为:0,-20,老师,同学,老师选择一定比例来抽查点名,同学根据风险偏好及其他条件来选择旷课还是迟到,游 戏,规则: 每位同学写一个数字ai。小数点后一位为5或0(例如2.5或1.0)。 ai0, ai 5 如果所有同学的数相加,求和。 若和大等于200,则每位同学期末成绩加5-ai ;若和小于200,则每位同学期末成绩-ai。,课后作业1,马克和刘东共租一房。他们对整洁优美有明显不同的观点,从而对于是否愿意花费必
8、要的时间来打扫房间也存在不同的看法。 假设至少需要12小时的打扫才能保持住所的清洁,至少需要9小时的打扫才能保持住所的还过得去,而少于9小时的打扫则使房间肮脏不堪。 又假设两人中每个人都可以奉献3、6或9小时进行打扫工作。 两人对过得去的房间效用值为2,而清洁和肮脏的房间效用值两人看法不一,马克认为它们分别值10和-10,刘东认为它们分别值5和-5 每个人的得益来自于各自对房间的干净程度的效用减去他打扫花费的时间。 请画出策略组合及得益矩阵,并分析博弈结果。,课后作业2(分析智猪博弈),在博弈论经济学中,“智猪博弈”是一个著名例子 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位成本,若大猪先到槽边,大小猪吃到食物的收益比是9:1;同时到槽边,收益比是7:3;小猪先到槽边,收益比是6:4。 在两头猪都有是有智慧的前提下,请分析猪的选择策略。 最终结果是小猪选择等待,大猪选择按按钮。 出现搭便车现象。试分析如何修改规则消除搭便车现象。,