10.1 纯对策问题,对策论,10.2 混和对策,Nash混和均衡策略,下面以两人每人两个策略的情况为例说明求Nash混合 均衡策略的条件。设G=S1 =(1,2),S2 =(1,2),u1(i,j),u2(i,j), 局中人1,2的混合策略分别为p1,p2和q1,q2,则局中人1 的期望收益为:,为了求p1,p2并使u1 *为极大值,我们把它化为下列的 非线性规划问题:,则它的Lagrange-Kuhn-Tucker函数为:,它的一阶必要条件(K-T条件)为:,10.3 动态对策,下面我们来看一个 无限步动态对策的例子。,对无限步的动态对策是无法用“逆推法”的。1984年 Shaked 和Sutton提出一种解决问题的思路,称为S-S原理:以例10.14为例, “从第一阶段开始与从第三阶段开始的无限 步动态对策的结论是一样的。”,第一步:甲出价S1,若乙接受,双方的得益为( S1 ,10000S1)。(若乙不接受进入下一步),第二步:乙出价S2, 若甲接受,双方的得益为( S2 , (10000S2)。(若乙不接受进入下一步),第三步:乙出价S3, 若乙接受,双方的得益为( 2S3 , 2(10000S3)。,根据S-S原理,S1 = 1000 10000 + 2 S3 = S3,