1、2018年6月18日,博弈论第二章第四节混合策略,1,社会福利博弈:无纳什均衡,流浪汉 寻找工作 游荡 救济政府 不救济,你救济,他就游荡;你游荡,他就不救济,2018年6月18日,博弈论第二章第四节混合策略,2,社会福利博弈的特征,不存在纳什均衡类似:父母给予懒惰的儿子多少资助?回望另一个不正常的博弈:情侣博弈两个纳什均衡,2018年6月18日,博弈论第二章第四节混合策略,3,思考,如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈?,2018年6月18日,博弈论第二章第四节混合策略,4,第二章 完全信息静态博弈,第四节 混合策略与期望支付,2018年6月18日,博弈论第二章第四节混合策略,
2、5,第四节 混合策略与期望支付,一、混合策略(一)案例:小偷与守卫的猫鼠博弈 守卫 睡 不睡 偷 小偷 不偷,2018年6月18日,博弈论第二章第四节混合策略,6,小偷与守卫博弈,无纳什均衡,如何分析?引入,2018年6月18日,博弈论第二章第四节混合策略,7,第四节 混合策略与期望支付,一、混合策略(二)混合策略1.表述:博弈方按照一定概率,随机从策略集中选择一种策略作为实际行动博弈方随机行动的目的:使自己的行为不被对手预测,2018年6月18日,博弈论第二章第四节混合策略,8,混合策略,小偷的混合策略:以p的概率偷,(p,1-p)守卫的混合策略:以q的概率睡(q,1-q),2018年6月1
3、8日,博弈论第二章第四节混合策略,9,第四节 混合策略与期望支付,一、混合策略(二)混合策略2.相对的概念:纯策略每个博弈方的非随机性选择纯粹行动计划,p=100%,1-p=0,2018年6月18日,博弈论第二章第四节混合策略,10,小偷与守卫博弈,守 卫 睡 q 不睡(1-q) 偷 p小偷 不偷(1-p),2018年6月18日,博弈论第二章第四节混合策略,11,第四节 混合策略与期望支付,二、期望支付1.概率(偷,睡)的概率:pq(偷,不睡)的概率:p(1-q)(不偷,睡)的概率:(1-p)q(不偷,不睡)的概率:(1-p)(1-q),2018年6月18日,博弈论第二章第四节混合策略,12,
4、第四节 混合策略与期望支付,二、期望支付2.期望支付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守卫= (-2) pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p),2018年6月18日,博弈论第二章第四节混合策略,13,第四节 混合策略与期望支付,三、研究方法最佳反应函数曲线交叉法1.案例:麦琪的礼物 Dela 剪发q 保留(1-q) 卖表pJim 保留(1-p),2018年6月18日,博弈论第二章第四节混合策略,14,三、研究方法:反应函数法,2.期望支付(1)UJim=(-2)pq+2p(1-q)+2(1-p
5、)q+0(1-p)(1-q)=2p(1-3q)+2q整理原则:一项含p,一项不含p(2)UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原则:一项含q,一项不含q,2018年6月18日,博弈论第二章第四节混合策略,15,三、研究方法:反应函数法,3.反应函数(1)Jim:Dela剪发的概率越小,Jim卖表越好,2018年6月18日,博弈论第二章第四节混合策略,16,三、研究方法:反应函数法,3.反应函数(2) Dela : Jim卖表的概率越小, Dela 剪发越好,2018年6月18日,博弈论第二章第四节混合策略,17,三、研究方法:反应函数法,4.反应函数曲线(1)交点(1,0)双方支付为2(2)交点(0,1)双方支付为2(3)交点(1/3,1/3)双方支付为2/3,q,p,1,1/3,1/3,1,互相为对方着想,期望支付变小,