1、Chap 4 非确定型决策方法,决策科学与艺术,2019/7/10,1 风险型决策(),风险型决策问题应具备以下几个条件: 1)具有明确的决策目标,例如,获取最大的 利润;2)有两个或两个以上的备选方案;3) 存在两种或两种以上的自然状态;4)各种自 然状态出现的概率是可以估计的(称为主观概 率);5)可以计算出不同备选方案在不同自 然状态下的效用值(不失一般性,可以目标函 数值取代效用函数值) 。,2019/7/10,一、最大可能法,选择发生概率最大的状态,而不必考虑其他状态(把一个风险型决策问题变成了确定型决策问题)。 1.决策规则:在决策时,先选择发生概率为最大的自然状态*,然后在该状态
2、下从可行方案集X中选择益损值为最大值的方案。 式中,x 决策变量;X 可行方案集,即决策变量的可行 域; 自然状态变量;Q 状态集;p() 状态 的概率;f (x, ) 在状态下选择方案x时的益损值。,2019/7/10,例5-1:,根据最大可能法,x2即为最优方案。,2019/7/10,2.最大可能法适用场合:,风险型决策问题中,当各自然状态中某一状态较其它状态出现的概率大得多,而且其它每个状态下各方案的益损值差别不大时,可采用最大可能法。,2019/7/10,二、期望值法,以目标函数的数学期望为基础,将不同方案在不同状态下的期望益损值进行比较,选择期望益损值最大或期望损失值最小的方案作为最
3、优方案。 期望值法的决策规则为:,式中,f(x) 期望益损函数;E 表示求 内随机变量 的数学期望。,2019/7/10,例5-2 :企业机器设备的最佳保养周期决策,假设企业现有机器n=50台,且修理一台坏机器的成本c1=100元,而每台机器每次保养费成本c2=10元。另外在第t年每台机器损坏的概率为pt,在第t年机器损坏的台数为nt,根据经验pt的值如表5-2所示。 决策:过多长时间对机器设备保养一次将使每年单位机器维修成本为最小?,2019/7/10,设维修时间间隔为x(年)。当x =T时,每年单位机器维修成本为:每年单位机器维修期望成本为:nt为随机变量,已知它服从二项分布B(n, pt
4、),E nt 为第t年内损坏的机器台数的均值,即E nt= n*pt,则 有:,2019/7/10,若要使E C(T )为最小而求得最佳保养周期T *,则必须满足以下条件:对T由小到大逐步计算 E C(T ),满足上述条件 的最优方案为x*=T *=3年,且,,2019/7/10,三、期望值方差法,期望值法主要适用于长期决策,它所追求的是长远期望效益。但在短期情况下,决策问题不仅要考虑期望效益,还要考虑短期内期望效益值的波动性 期望值方差法能有效地解决这个问题。,2019/7/10,期望值方差法的决策规则 既使期望益损最大,同时又使益损的方差为最小。,式中,Var 表示求 内随机变量的方差(v
5、ariance); k 风险厌恶系数,标志着决策者对益损期望值的偏离程度的态度。 k前的负号表明希望方差为最小。当决策者对收益在均值(数学期望值)以下的跌落特别敏感的话,可以将k值取比1大,即加大方差部分的权重,使取得低收益的几率减小。,2019/7/10,四、决策树法,决策树法具有直观明了,易于理解,便于分析等特点。 但是,如果备选方案和自然状态较多时,决策树就会过于庞大和复杂,这时用决策表和决策矩阵就比较方便。 根据所决策的问题是否具有阶段性,可将决策树法分为单级决策树法和多级决策树法。,2019/7/10,2019/7/10,五、矩阵法,矩阵决策法是期望值法的另一种形式,其决策规则与期望
6、值法相同。 特点是对多种自然状态、多种方案的优选分析更加简便易行,尤其是便于计算机处理。,2019/7/10,益损矩阵F与概率向量P的乘积为期望益损值向量:,其中,f ij = f (xi , j) 挑选出f (xi)中的最大值,它所对应的方案即为最佳方案:,2019/7/10,六、灵敏度分析(稳定性分析/敏感性分析),考察自然状态的概率和(或)后果的益损值的数据变动是否影响最优方案的选择,通过分析找到最优方案变动的临界点。 希望所作出的最优方案对这些数据变动的反应是不敏感的。,2019/7/10,例5-3 :农作物种植选择,2019/7/10,自然状态的概率变动对最优方案的影响:,2019/
7、7/10,计算上例中雨水状态的转折概率,设p代表“雨水多”这一状态出现的概率, (1-p)为“雨水少”状态出现的概率。 计算两个方案的期望益损值,并令其相等:解得:p=0.65,即为转折概率。当p0.65时,种植农作物甲是最优方案; 当p0.65时,种植农作物乙是最优方案。 当p值在0.65附近时,决策者应当对这一概率值仔细研究,避免由于概率估计的失误,造成决策的失误。,2019/7/10,2 风险型决策()贝叶斯法,为了使概率估计值更加准确,在能够获得后验信息的情况下,可用后验信息来调整先验概率值,得到后验概率分布。 后验概率分布可以通过贝叶斯公式对先验概率分布进行修正而获得。,2019/7
8、/10,用贝叶斯公式计算在调查结果y发生的条件下,自然状态i发生的概率,以此来修正i的先验概率p(i)。 贝叶斯公式:式中,p(i|y) 为各自然状态i发生的先验概率分布p(i) (i=1, , q)的修正值,即后验概率分布。,一、贝叶斯公式,2019/7/10,二、举例(例5-4),某自动化生产设备在生产过程中有两种状态1:正常;2:不正常。根据已往经验可知先验概率分布为p(1)=0.9,p(2)=0.1。 另外根据已往经验可知: 正常情况下该设备生产出的产品的合格率为80,不正常时产品的合格率仅为30。 试在以下几种情况下修正状态变量的概率分布: (1)从某时刻生产的产品中抽出一件发现是正
9、品; (2)从某时刻生产的产品中抽出一件发现是次品。,2019/7/10,(1)抽出1件正品,将从某时刻生产的产品中抽出一件正品这一试验结果记作y1,则根据题意有: p(y1|1)=0.8; p(y1|2)=0.3 由贝叶斯公式修正1和2的概率分布为:,2019/7/10,(2)抽出1件次品,记该试验结果为y2,由题意有:p(y2|1)=1-0.8=0.2; p(y2|2)=1-0.3=0.7 由贝叶斯公式修正1和2的概率分布为:,2019/7/10,3 不定型决策,不定型决策相对于风险型决策来说,由于相关概率无从知道,因此所作出的决策在很大程度上取决于决策者的决策经验、决策偏好、对自然状态的
10、判断、心理素质和对风险的态度等因素,其决策结果带有较大的主观性。,2019/7/10,典型不定型决策示例鸡蛋煎饼打蛋方案,2019/7/10,设: 1)做成有6个鸡蛋的煎饼的结果最理想,为100分; 2)由于一个坏鸡蛋污染了原来已打出的好鸡蛋,使煎饼做不成,结果最差,为0分; 3)煎饼中少一个鸡蛋,扣15分;浪费一个好鸡蛋扣20分;多洗1个碗,扣10分。,2019/7/10,各方案结果量化分值,2019/7/10,一、乐观法,1. 决策规则:先在每个行动方案对应的各种后果中选取益损值最大的后果,然后,比较这些后果的益损值,选取其中的最大者所对应的方案作为最优方案。即,决策规则为“最大最大规则”
11、(max-max规则),可表示为:,2019/7/10,例5-5:新建商场决定假日的供应水平,2019/7/10,2.乐观法适用场合,以激励效用为关键目标; 处于绝处求生状态; 评估竞争对手时; 决策前景看好; 决策实力雄厚; 。,2019/7/10,二、悲观法,1. 决策规则:“最大最小规则”(max-min规则),即先在每个行动方案对应的各种后果中选取益损值最小的后果,然后从中选择最大者所对应的方案为最优方案。,2019/7/10,例5-6:,2019/7/10,2.悲观法适用场合,企业规模小,资金薄弱,经不起大的冲击; 决策者对前景好的状态缺乏信息; 以外行动曾造成过重大损失; ,201
12、9/7/10,三、乐观系数法,对上述两种方法的一种折衷,用乐观系数表示乐观的程度,记作a。 其决策规则为:,2019/7/10,例5-7:,2019/7/10,四、后悔值法,1.思路:先确定某一状态下益损值最大的方案,当这一状态发生而决策者又没有选择这一方案时,实际益损值与最大益损值之差值(该方案在该状态下的机会损失),即为后悔值(regret value)或歉函数(regret function)值。 各方案在各状态下的后悔值可以构成一个后悔值矩阵(歉函数矩阵),对后悔值矩阵采用悲观法的“最大最小规则”进行不定型决策的方法称作后悔值法,或歉函数法。,2019/7/10,2.后悔值法的决策步骤
13、,(1)从益损矩阵中找出每列中最大的益损值,即每种自然状态下的“理想值”。 (2)用每列中的各益损值分别减去该列中的理想值,得到后悔值:计算出所有的后悔值后,益损矩阵就转化为后悔矩阵: (3)后悔值法的决策规则对后悔矩阵使用悲观法的“最大最小规则”决策:,(i=1, , r;j=1, , q),2019/7/10,例5-8:,已知益损矩阵:,打*号的益损值为每一列的理想值。,由此可得后悔矩阵为:,打*号的后悔值为每一行 的最小值(最后悔的值)。,即最佳方案是x4。,2019/7/10,五、等可能法,当决策者没有任何理由说明某一自然状态比另一状态有更多发生机会时,只能认为各状态发生的机会均等,即概率论中的“理由不充分原理”。 等可能法的决策规则如下:,2019/7/10,Thank you !,