1、第五章 贝叶斯决策分析,广西大学数学与信息科学学院 运筹管理系,5.1 贝叶斯决策的基本方法,5.1.1 贝叶斯决策的基本方法 管理决策的两种偏向:(1)缺少调查,(2)调查费用过高。 贝叶斯决策:为了提高决策质量,需要通过市场调查,收集有关状态变量的补充信息,对先验分布进行修正,用后验状态分布进行决策。 贝叶斯决策的意义贝叶斯决策可以做到少花钱多办事,提高决策分析的科学性和效益性。,有关的概率公式,离散情况设有完备事件组j(j=1, 2, , n),满足:,则对任一随机事件H,有全概率公式:,有关的概率公式,贝叶斯公式:,5.1 贝叶斯决策的基本方法,5.1.2 贝叶斯决策的基本方法 补充信
2、息(信息值)指通过市场调查分析所获取的补充信息, 用已发生的随机事件H或已取值的随机变量表示,称H或为信息值。 信息值的可靠程度用在状态变量的条件下,信息值H的条件分布p(H/)表示。,5.1.2 贝叶斯决策的基本方法,离散情形若取n个值j(j=l, 2, , n),H取m个值Hi(i1, 2, , m),则信息值的可靠程度对应一个矩阵贝叶斯决策的似然分布矩阵,5.1.2 贝叶斯决策的基本方法,利用市场调查获取的补充信息值Hi 或去修正状态变量的先验分布,即依据似然分布矩阵所提供的充分信息,用贝叶斯公式求出在信息值H或发生的条件下,状态变量的条件分布 p(/H)。 先验概率p() :由以往的数
3、据分析得到的概率; 后验概率p(/H):在得到信息之后,重新加以修正的概率。,贝叶斯决策的基本步骤,1.验前分析 依据数据和资料以及经验和判断,去测算和估计状态变量的先验分布p() ; 计算各可行方案在不同下的条件结果值; 根据某种决策准则评价选择,找出最满意方案。 2.预验分析比较分析补充信息的价值和成本的过程。 目的:判断是否值得去补充信息?,贝叶斯决策的基本步骤,2.预验分析 判断:如果信息的价值高于其成本,则补充信息给企业带来正效益,应该补充信息反之,补充信息大可不必。 注:如果获取补充信息的费用很小,甚至可以忽略不计,本步骤可以省略,直接进行调查和收集信息,并依据获取的补充信息转入下
4、一步骤。,贝叶斯决策的基本步骤,3.验后分析 利用补充信息修正先验分布,得到更加符合实际的后验分布; 再利用后验分布进行决策分析,选出最满意的可行方案; 对信息的价值和成本作对比分析,对决策分析的经济效益情况作出合理的说明 验后分析和预验分析的异同: 相同:都是通过贝叶斯公式修正先验分布 不同:主要在于侧重点不同,贝叶斯决策的基本步骤,4.序贯分析(主要针对多阶段决策)指把复杂的决策问题的决策分析全过程划分为若干阶段,每一阶段都包括先验分析、预验分析和验后分析等步骤, 每个阶段前后相连,形成决策分析全过程,p129例5.1,某工厂计划生产一种新产品,产品的销售情况有畅销(1),滞销(2)两种,
5、据以往的经验,估计两种情况发生的概率分布和利润如下表所示:,p129例5.1,为了进一步摸清市场对这种产品的需求情况,拟聘请某咨询公司进行市场调查和分析,该公司对销售情况预测也有畅销(H1)和滞销 (H2)两种,对畅销预测的准确率为0.95,对滞销预测的准确率为0.9:,p129例5.1,解: 1、验前分析 记方案a1 为生产该新产品,方案a2 为不生产。 则: E (a1)=1.1(万元),E (a2)=0记验前分析的最大期望收益值为E1,有:E1maxE (a1),E (a2) =1.35。因此验前分析后的决策为:生产该新产品。 即: aopt a1 E1为不作市场调查的期望收益。,p12
6、9例5.1,2、预验分析:由全概率公式,得:,p129例5.1,2、预验分析: 再由贝叶斯公式,得:,p129例5.1,2、预验分析:用后验分布代替先验分布,计算各方案的期望收益值。当市场调查值为 H1(产品畅销)时:,aopt (H1) a1 即:市场调查畅销时,最优方案是生产该新产品。,p129例5.1,2、预验分析: 当市场调查值为 H2(产品滞销)时:,aopt (H1) a2 即:市场调查滞销时,最优方案是不生产该新产品。,p129例5.1 是否该进行市场调查?,假定咨询公司收费为0.1万元。 2、预验分析:通过调查,该企业可获得的收益期望值为:,通过调查,该企业收益期望值能增加,因
7、此,只要调查费用不超过0.0301万元,就应该进行市场调查;否则,则不应进行市场调查。,不应进行调查,p129例5.1,3、验后分析:综上所述, 在咨询公司收费不超过0.0301万元的情况下,进行市场调查,能使该企业新产品开发决策取得较好的经济效益;否则,不做市场调查。 若调查结果是该产品畅销,则应该选择方案a1,即生产新产品; 若调查结果是该产品滞销,则应该选择方案a2,即不生产新产品。,p132例5.2,某企业为开发某种新产品需要更新设备,有三种方案可供选择:引进大型设备(a1)、引进中型设备(a2)、引进小型设备(a3)。市场对该新产品的需求状态也有三种:需求量大(1)、需求量一般(2)
8、 、需求量小(3) 。根据市场预测,企业的收益矩阵如下(单位:万元):,例5.2,根据历年资料,该产品各需求状态的概率分别为p(1)=0.3,p(2)=0.4,p(3)=0.3。为使新产品开发产销对路,该拟试销作市场调查,试销结果可能有三种:需求量大(H1)、需求量一般(H2)、需求量小(H3)。调查结果值的可靠性如下表所示:,试对该企业新产品开发方案进行决策。,p132例5.2,解:1、验前分析,E1maxE (a1),E (a2),E (a3) =17 因此验前分析后的决策为:引进大型设备。 即: aopt a1 E1为不进行试销(市场调查)的期望收益。,p132例5.2,2、预验分析:由
9、全概率公式,得:,p132例5.2,2、预验分析: 再由贝叶斯公式,得:,p132例5.2,p132例5.2,2、预验分析:用后验分布代替先验分布,计算各方案的期望收益值。当市场调查值为 H1(需求量大)时:,p132例5.2,2、预验分析: 当市场调查值为 H1(需求量大)时:,aopt (H1) a1 即:试销为产品需求量大时,最优方案是引进大型设备。,p132例5.2,当市场调查值为 H2(需求量一般)时:,aopt (H2) a1 即:试销为产品需求量一般时,最优方案也是引进大型设备。,p132例5.2,当市场调查值为 H3(需求量小)时:,aopt (H2) a3 即:试销为产品需求
10、量小时,最优方案是引进小型设备。,p132例5.2,3、验后分析:通过试销,该企业可获得的收益期望值为:,该企业收益期望值能增加:,只要试销所需费用不超过3万元,就应该进行市场调查;否则,则不应进行试销。,p132例5.2,3、验后分析: 在试销费用不超过3万元的情况下,进行试销,能使该企业新产品开发决策取得较好的经济效益;若试销费用不超过3万元,则不应进行试销。 若试销结果是该产品需求量大或一般,则应该选择方案a1,即引进大型设备; 若调查结果是该产品需求量小,则应该选择方案a3,即引进小型设备。,5.2 贝叶斯决策信息的价值,从前面的分析看出,利用补充信息来修正先验概率,可以使决策的准确度
11、提高,从而提高决策的科学性和效益性。因此,信息本身是有价值的能带来收益。 但获得的情报越多,花费也更多。 因此有一个获取补充信息是否有利的问题:收益与成本的比较。 问题:如何衡量信息的价值?,5.2 贝叶斯决策信息的价值,5.2.1 完全信息的价值(EVPI) 完全情报:指能够提供状态变量真实情况的补充信息。即在获得补充情报后就完全消除了风险情况,风险决策就转化为确定型决策。 1.完全信息值设Hi 为补充信息值,若存在状态值0,使得条件概率P(0/ Hi)=1 ,或者当状态值 0时,总有P(/ Hi)=0 。则称信息值Hi为完全信息值。(补充信息可靠性100%),5.2.1 完全信息的价值(E
12、VPI),2.完全信息值Hi的价值设决策问题的收益函数为Q=Q(a,),其中a为行动方案,为状态变量。若Hi为完全信息值,掌握了Hi的最满意的行动方案为a(Hi) ,其收益值为 Q(a(Hi),)maxQ(a,) 验前最满意行动方案为aopt ,其收益值为Q(aopt ,),则称掌握了完全信息值Hi前后的收益值增量:,为在状态变量为时的完全信息值Hi的价值。,5.2.1 完全信息的价值(EVPI),3.完全信息价值如果补充信息值 Hi对每一个状态值都是完全信息值,则完全信息值Hi 对状态的期望收益值称为完全信息价值的期望值(expected value of perfect informati
13、on),简称完全信息价值,记做EVPI。,5.2.1 完全信息的价值(EVPI),在例5.1中如果补充信息(咨询公司市场调查)的准确度很高,预测畅销,则100%畅销;预测滞销,则100%滞销;这时:P(1/ H1)=1, P(2/ H1)= 0 P(1/ H2)=0, P(2/ H2)= 1 则H1(咨询公司预测畅销)、H2(咨询公司预测滞销)都是完全信息值(完全情报)。,5.2.1 完全信息的价值(EVPI),在例5.1中,若H1、H2都是完全信息值验前最满意行动方案为a1 (生产新产品) 完全信息值H1的价值=1.5-Q(a1,1)=1.5-1.5=0 完全信息值H2的价值=0-Q(a1,
14、2)=0-(-0.5)=0.5 完全信息价值为:,5.2.2 补充信息的价值(EVAI),1.补充信息价值实际工作中取得完全情报是非常困难的。 补充信息值Hi 的价值: 决策者掌握了补充信息值 Hi前后期望收益值的增加量(或期望损失值的减少量)。 补充信息价值:全部补充信息值Hi 价值的期望值,称为补充信息价值的期望值。简称补充信息价值,记做EVAI(Expected Value of Additional Information)。,2、补充信息价值(EVAI)的计算,公式1:,其中:a()表示在信息值下的最满意方案, E/表示在信息值的条件下对状态值求收益期望值。,公式2:,公式3:R(a
15、,)表示决策问题的损失函数,例5.1中:验前最满意行动方案为a1 (生产新产品),E(aopt,)=E(a1,)=1.1万元a(H1)=a1, a(H2)=a2,EVAI=1.13-1.1=0.03万元,5.2.3 EVAI 与EVPI 的关系,任何补充信息价值都是非负的,且不超过完全信息的价值。 即: EVPIEVAI0 信息价值对管理决策的意义任何补充信息决不会降低决策方案的经济效益!完全信息是一类特殊的补充信息,是价值的信息。,5.3 抽样贝叶斯决策,问题:如何获取补充信息 ? 主要途径:抽样调查 5.3.1 抽样贝叶斯决策的基本方法 1.抽样贝叶斯决策利用抽样信息值作为补充信息值,去修
16、正状态变量的先验分布,得到后验分布,再依据后验分布进行的贝叶斯决策。 2.抽样贝叶斯的决策步骤验前分析、预验分析、验后分析,5.3 抽样贝叶斯决策,例5.8 设某公司的一条生产线成批地生产某种零件,每批为800件。现将零件组装成仪器,根据过去的统计资料分析,零件的次品率及其相应的概率如表52。若组装成仪器调试时,发现次品零件则需要更换,每件更换的改装费为15元。若采取某种技术措施,可使每批零件的次品率降到最低为0.02,但每批要花费技术改造费500元。,例5.8,进行技术改造之前,采取抽样检验,抽取20个零件,发现一个次品。试对该公司是否应该采取技术改造措施作出决策分析。,例5.8 验前分析,
17、方案: 不采取技术措施(a1),采取技术措施(a2),E1minE (a1),E (a2) =740 因此验前分析后的决策为:采取技术措施。即:aopt a2,例5.8 :预验分析,如果允许抽样检验,设X=“抽取个零件中所含废品个数”,则:P(X=kj)=C20kjk (1- j)20-k,k=0, 1, , 20,j=1, 2, , 5 计算得:P(X=11)= 0.2725, P(X=12)= 0.3774P(X=13)= 0.2702, P(X=14)= 0.1368P(X=15)= 0.0576,例5.8 :预验分析,后验概率:P(1X=1)=0.3903, P(2X=1)=0.405
18、3P(3X=1)=0.1451, P(4X=1)=0.0490P(5X=1)=0.0103 两方案的期望费用值:,因此抽到1个次品后的决策为:不采取技术措施。即:aopt a1,例5.8 :预验分析,如果抽样20个未抽到废品P(X=01)= 0.6676, P(X=02)= 0.3585P(X=03)= 0.1216, P(X=04)= 0.0388P(X=05)= 0.0115,后验概率:P(1X=0)=0.6722, P(2X=0)=0.2707P(3X=0)=0.0459, P(4X=0)=0.0098P(5X=0)=0.0014,例5.8 :预验分析,如果抽样20个未抽到废品,两方案的
19、期望费用值:,因此若未抽到次品,则决策为:不采取技术措施。即:aopt a1,例5.8 :预验分析,如果抽样20个抽到2个废品P(X=21)= 0.0528, P(X=22)= 0.1887P(X=23)= 0.2852, P(X=24)= 0.2293P(X=25)= 0.1369,后验概率:P(1X=2)=0.1406, P(2X=2)=0.3766P(3X=2)=0.2846, P(4X=2)=0.1526P(5X=2)=0.0456,例5.8 :预验分析,如果抽样20个抽到2个废品,两方案的期望费用值:,决策为:采取技术措施。即:aopt a2 。同理,当抽样20个抽到的废品数超过2个
20、时,应选择采取技术措施。抽样后决策的期望费用为:,比未经抽样就进行决策,其费用可减少:,p148例5.9,某公司降价销售一批某种型号的电子元件,这种元件一箱100个,以箱为单位销售。已知这批元件每箱的废品率有三种可能,即 0.20,0.10,0.05,其相应概率分别是0.5,0.3,0.2。假设该元件正品的市场价格为每箱100元,废品不值钱。该公司处理价格每箱为85元,遇到废品不予更换。某乡镇企业正需要购买这种元件,该企业应如何作出决策?如果该公司允许购买前从每箱中抽取 4个元件进行检验,确定所含废品个数,假定抽样是可放回的,该企业应如何作出决策。,p148例5.9 验前分析,设a1,a2分别
21、表示该企业购买和不购买这批元件的可行方案。,E1maxE (a1),E (a2) =1 因此验前分析后的决策为:购买该批产品。即:aopt a1,例5.9 :预验分析,如果允许每箱抽样4个检验,设X=“抽取个零件中所含废品个数”,则:P(X=kj)=C4kjk (1- j)4-k,k=0, 1, , 4,j=1, 2, 3 计算得: P(X=01)= 0.4096P(X=02)= 0.6561P(X=03)= 0.8145,例5.9 :预验分析,后验概率:P(1X=0)=0.3628P(2X=0)=0.3487P(3X=0)=0.2885 两方案的期望收益值:,因此若抽样4个未抽取到废品,应购
22、买该批产品。即:aopt a1,例5.9 :预验分析,P(X=11)= 0.4069, P(X=12)= 0.2916P(X=13)= 0.1715,后验概率: P(1X=1)=0.6271 P(2X=1)=0.2679, P(3X=1)=0.1050,因此若抽样4个抽取到1个废品,则不应购买该批产品。即:aopt a2,例5.9 :预验分析,P(X=21)= 0.1536, P(X=22)= 0.0486P(X=23)= 0.0135,后验概率: P(1X=1)=0.8163 P(2X=1)=0.1550, P(3X=1)=0.0287,因此若抽样4个抽取到2个废品,则不应购买该批产品。即:
23、aopt a2 。同理:抽到废品3、4个时,也不应购买该批产品,例5.9 :验后分析,因此若抽样4个未抽取到废品,则应选择购买该批产品(a1),预期收益为2.815元;否则不应购买该批产品(a2),预期收益为0。 抽样的预期收益为:,比未经抽样就进行决策,其收益可增加:,5.3 抽样贝叶斯决策,5.3.2 抽样信息的价值当补充情报是采用抽样的方法获得时,这种补充情报价值习惯上称为抽样情报价值(Expected Value of Sampling Information)记做EVSI。 在例5.8中EVSI=E1- E2=167.55(元) 在例5.9中EVSI=E2- E1=0.59(元),5
24、.3 抽样贝叶斯决策,5.3.3 最佳样本容量 在抽样贝叶斯决策中,抽样所支付的费用叫抽样成本。样本容量为N时的抽样成本记为C(N)。 当样本容量N确定以后,抽样情报价值也随之而确定。抽样情报价值也是N的函数,记为EVSI(N)。 抽样净收益:ENGS(N)=EVSI(N)-C(N) 最佳样本容量:使ENGS(N)达到最大值的非负整数,5.4 贝叶斯风险和贝叶斯原则,5.4.1 决策法则 从补充信息值(或H) 的集合到行动方案集合A的单值对应称为决策法则。记作:,若某个决策问题有m个行动方案,有n个补充信息值,则至多有mn个决策法则。,最佳决策法则:在一个决策问题的所有决策法则中,按照某一原则
25、选出的最佳者,称为该决策问题的最佳决策法则。,5.4.1 决策法则,例5.1中,有两个行动方案:a1 为生产该新产品,a2 为不生产该新产品。有两种补充信息:畅销(H1)和滞销 (H2)共有4种决策法则:,按照期望收益值最大原则选出的最佳决策法则是2(H)。,5.4 贝叶斯风险和贝叶斯原则,5.4.2 贝叶斯风险 设贝叶斯决策法则(),对于状态变量的任一值,当补充信息值确定后,行动方案a= () 也就相应确定,则对应的损失值为R(),),损失值越小,决策法则越优。 风险函数(,):损失值R(),)对所有补充信息值的数学期望。,5.4 贝叶斯风险和贝叶斯原则,5.4.2 贝叶斯风险风险函数(,)
26、是在状态值下,决策法则对全部补充信息值的平均损失。 例5.1中,损失矩阵为,决策法则1(H)a1 的风险函数值为:,5.4.2 贝叶斯风险,决策法则2(H)的风险函数值为:,同理可求出决策法则3(H)和4(H)的风险函数值:,5.4 贝叶斯风险和贝叶斯原则,5.4.2 贝叶斯风险 贝叶斯风险 B()对决策法则,风险函数(,)对状态的数学期望,称为决策法则的贝叶斯风险。,贝叶斯风险B()是一个常数,表示决策法 则,对一切补充信息值和状态值的平均损失值。,5.4.2 贝叶斯风险,例5.1中:,同理可求出决策法则B(2)、B(3)和B(4),5.4 贝叶斯风险和贝叶斯原则,5.4.3 贝叶斯原则 以贝叶斯风险作为评价决策法则优劣的原则称为贝叶斯原则。(以贝叶斯风险小的决策法则为优) 最佳决策法则:在贝叶斯原则下,贝叶斯风险最小的决策法则称为最佳决策法则。 如例51中:B(2)B(1)B(4)B(3) 因此:最优决策法则为2,这与之前贝叶斯决策的结论完全一致。,5.4 贝叶斯风险和贝叶斯原则,5.4.3 贝叶斯原则 可以证明:贝叶斯决策所得到的决策法则,就是贝叶斯原则下的最佳决策法则。 并且,最佳决策法则的贝叶斯风险等于完全信息价值与补充信息价值之差(后验完全信息价值)。 即: B(opt)EVPIEVAI,