1、博弈方法及其应用,典型的囚徒问题,两个嫌犯受到指控,但除非至少一个招认,否则警方不能将二人判有罪。警察把二人分别带到不同的房间,告之后果:如果二人均不坦白,将被判入狱一个月。如果双方均坦白,将被判入狱6个月。如果一方招认,另一方不招,招认一方马上释放,另一方判入狱9个月(6+3)。,博弈现象的三要素,局中人参与博弈但利益不完全一致者。有二人博弈与多人博弈之分。 策略集每个局中人都会有一系列的策略可选,称为对应于每个局中人的策略集。有限和无限个对策。 收益在每策略组合下每一局中人的收益情况。是选择策略的标准。收益函数或支付函数。,例1:,甲乙二人在桌上各放一枚硬币,如果同向。甲赢一场;两面不同,
2、乙赢一场。比赛两场告终。二战全胜者可占有对方的硬币。局中人:甲、乙二人 策略集合:二人均为:正正、正反、反正、反反四个策略。(有限) 甲的收益函数见下表(乙的为甲的相反数):,重复剔除严格劣势策略,严格劣势策略 如果某一局中人的两个策略S1与S2,有如下关系:对于其他局中人的所有策略,均有S1的所有收益S2的所有收益,则称S2相对于S1是严格劣势策略。 还需要假定 所有局中人间相互了解 所有局中人是理性的 所有局中人都知道上述假定 有时没有严格劣势策略,例2 囚徒问题的求解,例1的求解无严格劣势策略,一个新问题无法剔除,纳什均衡,对于每一个局中人i,在其他人所有策略的任一组合中,均有一个策略S
3、i*的收益不小于S的其它策略的收益,称所有的S*是这个博弈问题的一个纳什均衡。 纳什均衡比重复剔除严格劣势策略要求更严格,不会被剔除掉。 1950年纳什证明任何有限博弈中都存在一个纳什均衡。,囚徒问题的纳什均衡,例1的纳什均衡:混合战略在概率意义上的均衡,新问题的纳什均衡,性别战博弈,不在同一地方工作的帕特与克里斯安排周末晚上的娱乐节目:,二人0和博弈,如例一,A的收益等于B的损失 可简化矩阵为,乙的策略,甲的收益,甲的策略,例3,某乡村学校在秋季购买冬季取暖用煤的总费用如下:,鞍点的求法:行最小与列最大,例4 与外商谈判购买设备,外方,中方,降价,思考,例1有无鞍点? 鞍点与严格劣势策略及纳什均衡的关系。 构造就业谈判中关于薪水的博弈问题。,