收藏 分享(赏)

连续对策的最优策略.ppt

上传人:tkhy51908 文档编号:6848715 上传时间:2019-04-24 格式:PPT 页数:27 大小:294.50KB
下载 相关 举报
连续对策的最优策略.ppt_第1页
第1页 / 共27页
连续对策的最优策略.ppt_第2页
第2页 / 共27页
连续对策的最优策略.ppt_第3页
第3页 / 共27页
连续对策的最优策略.ppt_第4页
第4页 / 共27页
连续对策的最优策略.ppt_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、连续对策的最优策略,回顾,定理3.3.3 连续对策 的支付函数 在 上连续,则 有解的充要条件是 并且此时对策 的值等于上式的公共值。分析:一,对策有解的充要条件二,对策的值,回顾,定理3.3.4 连续对策 的支付函数 在 上连续,则 有解。 (连续对策的基本定理)(条件比较弱) 分析:判断是否有解:支付函数存在且连续。,3.4连续对策得最优策略,条件: 连续对策 的支付函数 在 上连续 分布函数 是否为局中人甲的最优策略? 如果不是需要什么条件?分布函数 是否为 乙的最优策略?需要什么条件?如果上述条件成 立能推导出什么结论?,3.4连续对策得最优策略,连续对策 的支付函数 在 上连续 分布

2、函数 为局中人甲的最优策略成立会有 什么结论? 推导: 结果:不是一个结果哦,试试看 结论是否能推出假设条件?,3.4连续对策得最优策略,设 为甲的最优策略,则存在分布函数 ,使 因为纯策略是混合策略的特例,所以 逆推: 假设 为分布函数,且 则 由定理3.3.4知, 一定有解,因此存在分布函数 和 使,3.4连续对策得最优策略,从而 再由上式, 所以 于是,这表明 为 的解, 为甲的最优策略。,3.4连续对策得最优策略,第一个结果 定理3.4.1 连续对策 的支付函数 在 上连续 (1)分布函数 是否为局中人甲的最优策略当且仅当 (2)分布函数 是否为局中人乙的最优策略当且仅当,3.4连续对

3、策得最优策略,设 为甲的最优策略,则存在分布函数由定理3.4.1知,若 则,3.4连续对策得最优策略,矛盾。故 逆推: 设分布函数 ,使得 则, 由定理3.4.1知, 为甲的最优策略。,3.4连续对策得最优策略,第二个结果 定理3.4.3 连续对策 的支付函数 在 上连续 (1)分布函数 是否为局中人甲的最优策略当且仅当 (2)分布函数 是否为局中人乙的最优策略当且仅当,定理3.4.2 连续对策 的支付函数 在 上连续, 和 为分布函数,则 为 的解当且仅当存在数 v,使得并且此时,证明:设 为的 解 取 即可 逆推:设存在数v设存在数 , 使 成立 则,即 特别有 故 于是 为 的解.,3.

4、4连续对策得最优策略,定理3.4.3进一步 推论3.4.4 连续对策 的支付函数 在 上连续 (1) 为局中人甲的最优策略当且仅当(2) 为局中人乙的最优策略当且仅当,3.4连续对策得最优策略,定理3.4.3和推理3.4.4都是要知道对策的值,才 能进行推导和使用,因此使用起来并不方便。继 续改进推理3.4.4的内容。,3.4连续对策得最优策略,定理3.4.5 连续对策 的支付函数 在 上连续 分布函数 和 分别为局中人甲和局中人 乙的最优策略当切仅当 (3.4.3) 并且此时 等于上式的公共值。 应用:求解对策的值。,3.4连续对策得最优策略,证明 : 设分别 , 为甲,乙的最优策略,则由定

5、理3.4.3知设(3.4.3)式成立.由定理3.3.3和定理3.3.2知 成立 从而由(3.4.3)式有根据定理3.4.3 和 分别为甲和乙的最优策略.,3.4连续对策得最优策略,在有了以上的讨论您是否想过对策的值是否可以 为零?什么条件下为零?局中人有是否有相同的 最优策略集?什么情况下有相同的最优策略集?,3.4连续对策得最优策略,定理3.4.6 连续对策 的支付函数 在 上连续且 是对称的,即则 ,且两个局中人有相同的最优策略集。 证明:,3.4连续对策得最优策略,证明: 设 和 分别为局中人甲和乙的任何最优策略,则 为 的解,从而任给分布函数 和 ,有把上式同乘以-1,并利用 ,得任给

6、的分布函 数 和,3.4连续对策得最优策略,所以, 为甲的最优策略, 为乙的最优策略.由 与 的任意性知,两个局中人有相同的最优策 略集,因此故,3.4连续对策得最优策略,例3.4.1 连续对策 的支付函数 试求解 记,3.4连续对策得最优策略,不难知道所以定理3.4.5知, 和 分别为甲和乙的最优策略,对策值,3.4连续对策得最优策略,例3.4.2 连续对策 的支付函数 试讨论之。 因为 ,所以由定理3.4.6,对策值 ,且两个局中人有相同的最优策略.可以证明 为甲的最优策略.这是因为,3.4连续对策得最优策略,所以,根据定理3.4.5, 为甲的最优策略, 为乙的最优策略。,3.4连续对策得最优策略,注意:连续对策的求解没有标准的程式可循。一般是利用定理3.4.5,试探性地寻找某些特殊的分布函数作为局中人的最优策略。例如例3.4.1,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报