第8章动态规划.doc-道客多多_道客多多docduoduo.com

资源描述

1、1第 8 章动态规划1 多阶段的决策问题动态规划是一种研究多阶段决策问题的理论与方法。所谓多阶段决策问题是这样一类的决策过程：它可以系为若干个相互联系的阶段，在每一阶段分别对应着一组可以选取的决策，当每个阶段的决策选定以后，过程也就随之确定。把各个阶段的决策综合起来，构成一个决策的序列，称为一个策略。显然，由于各个阶段选取的决策不同，对应整个过程可以有一系列的策略。当对过程采取某一策略时，可以得到一个确定的（或期望）的效果，采取不的策略，就会有不同的效果。多阶段决策问题，就是要在可能采取的策略中间选取一个最优的策略，使得在预定的标准下得到最好的效果。例 1 最短路问题设有一个旅行者从图中的

2、A 出发，途中要经过 B，C，D 等处，最后到达 E。从 A 到E 有很多路线（18 条）可以选择，各点之间的距离为已知，问该旅行者应选择哪一条路线，使从 A 到达 E 的总的路程为最短。3347 1251B3B2C312DEA2536356345143例 2设有某种机器设备，用于完成两类工作 A 和 B，若 k 年初完好机器的数量为，若ks以数量用于 A，余下的用于工作 B，则该年的预期收入为。这kxksx()kgshx里的和是已知函数，且。又机器在使用中会有损坏，设机器用()gh(0)gh于工作 A 时一年后能继续使用的完好机器数占年初投入量的 %；若用于 B 项工作，一年a

3、后能继续使用的完好机器数占年处投入量的 %，即下一年初继续使用于完成这两项工作b的设备数为。设第一年初完好的机器的总数为，问在连续三年内1()kkksaxbs0s每年应如何分配用于 A，B 两项工作的机器数，使三年的总收益最大？例 3将一个数分成 n 个部分之和，且，问如(0)C12,nC ,(12,)iC何分配是其乘积最大？1nii21max.0,(2,)niiiiZCst 1max.0,(2,)niiiZCstx在多阶段决策问题中，有些阶段的划分表现出明显的时序性，如例 1 和例 2，动态规划的“动态”二字由此而设名。但如例 3，本是一个非线性规划问题，如果把分成 n 个部分

4、，人为地作为 n 个阶段进行处理，就可以把一个静态问题当作一个动态问题来研究。一般多决策问题较之单决策问题要复杂的多，根据实际问题构造动态规划的模型往往需要更多的技巧。32 最优化原理与动态规划的数学模型2-1 动态规划的解题思路动态规划问题的复杂在于各决策之间的相互联系。如例 1 中，从不能只考虑123BA:一段最优。因为分段孤立的最优，整体却不一定最优。如果把 A 到 E 的所有可能的路条全部列出来，找其中最短的一条路，穷举法不切合实际。3218用动态规划方法解题的思路是：将一个 n 阶段决策问题化为依次求解 n 个是有递推关系的单阶段问题，从而简化计算的过程。在例 1 中，这种转化的实

5、现是从终点 E 出发的一步步进行反推，这种算法称为逆序算法（在动态规划问题的计算中一般采用逆序算法），具体步骤如下：（1）考虑一个阶段的最优选择，按逆序推算，旅行着到达 E 点前，上一站必然到达，如果上一站为，则该阶段的最优决策为，如果2,D1D1D11(),)3,fdD上一站为，则该阶段的最优决策为，。2E22(),4f（2）联合考虑两个阶段的最优选择， 111 122(,)(3()minmin4 dCff CED112 2122(,)(6()i i7 3ff Dd 3113 3122(,)()inin 4Cff CED（3）再考虑三个阶段的联合选择 11122 1133(,)

6、(7()minmin5, , 6dBff BDCf2112 22133()(4()i,i7, fBdf CE113322323(,)(5()minmin8, , 6Cff BDdBf（4）当四个阶段联合考虑时4这就是1122 3233(,)(1()minmin57, , 8dABff ABCDEf最短路和最短距离。从以上的解题可以看出，将一个多阶段的决策问题转化为依次求解的多个单阶段的决策问题时，一个重要的特征是将上一阶段的解传递纳入下一阶段考虑，即做到求解的多个阶段间是具有传递性的。为了将上述解题的思路、步骤推广应用于比较复杂的多阶段决策问题中去，需要引入动态规划的一些基本概念。2-2 动态

7、规划的基本概念1阶段是指一个问题需要作出决策的步数，通常用 k 表示问题的所包含的阶段数，称为阶段变量。K 的编号方法有两种（1）顺序编号法（2）逆序编号法2状态这是动态规划中最关键的一个参数，它既反映多阶段决策的结局，又是本阶段作出决策的出发点和依据。状态是动态规划问题多阶段信息传递点和结合点，第 k 阶段的状态变量是应包含该ks阶段之前决策过程的全部信息，做到从该阶段后作出的决策同这之前的状态和决策相互独立，各阶段的状态通常用状态 s 来描述。例 1 中对旅行者每个阶段所处的位置只需用一个状态变量来描述，但有些问题多阶段的的状态则要用多个变量或向量的形式来描述。向量中所包含的个数称为

8、动态规划中的维数，动态规划的工作量随维数的增大呈指数倍增大，这种情况称为维数障碍或维数灾难，从而极大的限制了动态规划问题的实际应用。3决策是指某阶段处从给定的状态出发，决策者在面临的若干种不同的方案中作出的选择。决策变量表示第 k 阶段状态为时对方案的选择。的取值要受到一定范()kxsks()kxs围的限制，表示 k 阶段状态为时决策允许的取值范围，因而有，D ()()kkDs，如果选取下一个到达点为，则。123(),BC2C12()xB4策略和子策略动态规划问题中多阶段决策组成的序列总体称为一个策略。含 n 个动态规划问题的策略可以写成为：，如12(),()nxss等。

9、121ADE把从某一阶段开始到过程最终的决策序列称为问题的子过程策略或子策略，从 k 阶段起的策略可以写成：，如等都是自策略。1(),),()kknxsxs 121BCDE5状态转移律从的某一状态出发，当的取值决定后，下一阶段的取值也随k 1ks之而确定。这种从上阶段的某状态的值到下阶段某状态值的转移规律称为状态转移律。显然，下一阶段的状态的取值是上一阶段变量和上阶段决策变量的函数，记为1ksks()kx5或简写为称为状态转移方程：如，1(,)kksTxs1(,)kksTx21sB，那么它是与的函数。2)C326指标函数有阶段的指标函数和过程的指标函数之分。阶段的

10、指标函数是对应某一阶段和从该阶段出发的一个阶段的决策的某种效益变量，用表示，如：之分。(,)kvsx21(,)7,65kvBx过程的指标函数是从状态出发至过程的终点，当采取某种子策略时，2)sn按预定的标准得到的效益值，这个值与的效益值有关，又与以后的选取的策略有关，k ks它是两者的函数值，记作，。,knV,1(,)knsx过程的指标函数又它所包含的各阶段指标函数的函数。按问题的性质，它可以是各阶段指标函数的和、积或其他函数形式。当的值确定后，指标函数的值就只同阶段的子k k策略有关。所谓最优指标函数，是指对某一确定状态选取最优策略后得到的指标函数值，实际上也就是对应某一最优

11、子策略的效益值记作，于是有，这里的代()kfs,()kknfsoptVopt表最优化决策，根据效益值的具体含义可以求或maxin阶段 k(,)Tsx阶段 1k(,)Tsx状态状态状态ks1ks 2ks决策 ()kxs决策 1()ks(,)kvs11(,)kkvs2-3 最优化原理与动态规划的数学模型将来阶段决策的指标效益值加上从下阶段开始采取最优策略是的指标效益值，这是一种递推关系式，按逆序算法时可以从最后一个阶段反推到过程的开始。美国的 Bellman 在1950 年据此提出来解动态规划的最优化原理如下：作为整个过程的最优策略具有这样的性质：无论过去的状态和决策如何，对先前决策的

12、形成的状态而言，余下的决策必构成最优策略。动态规划的基本方程当时，,(,)nkiiVvsx1()(),)()kkkkxDsfoptvxfs6当时，,(,)nkiiVvsx1()(),)()kkkkxDsfoptvxfs作为动态规划的数学模型，除基本方程外，还包括边界条件。所谓边界条件是指上两式中当时的值，也即问题从最后一个阶段向前递推时的标准条件。n1()nfs一般，当指数函数值是各阶段指数函数值的和时，取 =0；当指数函数值是1()nfs各阶段指数函数值的积时，取，当然也有个别例外的情况。1()nfs为构造和求解动态规划的数学模型，需要明确模型中有关阶段的划分、状态变量、决策变量，

13、允许决策集合和状态转移方程，要注意下述多点：（1）状态变量的确定是构造动态规划中最关键中的一步，它要求对研究的问题有深入的观察和了解，状态变量首先应描述反过程的演变特征，其次它包含到达这个状态前的足够信息，而且有无后效性。即到达这个状态前的过程的决策将不影响到该状态以后的决策。状态变量还应具有可知性，即规定的状态变量的值可通过直接或间接的方法测知。状态变量可以是离散的，也可以是连续的。（2）决策变量是对过程进行控制的手段，复杂的问题中决策变量也可以是多维的向量，它的取值可能离散，也可能连续。允许决策集相当于线形规划问题中的约束条件。()kDs（3）状态转移律，当给出的取值后，如果的取值

14、唯一决定，1(,)kksTx,x1ks相应的多阶段决策过程为确定性的多阶段过程。在有些问题中，对给定的，相应的kx和的的取值不是确定的，而且是有某种概率分布的随机变量，但它的概率分布则由、1ks sx唯一确定。这类多阶段的决策过程称为随机多阶段决策过程。（4）指数函数是衡量决策过程效益高低的指标，它是一个定义在全过程或从到阶段kn的过程上的数量函数。为了进行动态规划的计算，指标函数必须具有递推性，即能写成如下的关系式：或。, 1,(,)knkknVvsxV, 1,(,)knkknVvsxV2-4 逆序解法和顺序解法动态规划问题的求解有两中基本方法：逆序解法和顺序解法。所谓逆序解法：

15、是从问题的最后一个阶段开始，逆多阶段决策的实际过程反向寻优。而顺序解法则是从问题的最初的阶段开始，同多阶段决策过程顺序寻优。对具体问题需要采取哪一种求解方法应根据问题的初始条件和边界条件来决定。但大多数采用逆序解法。以资源的动态规划分配为例，表示从第 1 到第 k 阶段的可使用的资源数量，因而第ksk-1 阶段的状态，是第 k 阶段的状态和第阶段决策的函数，故顺序解法中的状态转移方1ks程可以表示为：，第 k-1 阶段的指标函数表示为：。1(,)kTx 1(,)kkvsx7用表示第 k 阶段状态为，从第 1 到第 k-1 阶段才却的是最优子策略时余 k-1 个1()kfs ks阶段

16、的最优指标函数值，则由动态规划的最优化原理，采用顺序解法时，动态规划的数学模型可以表示如下：（1）当各阶段指标函数为求和关系时，有 11()0(),)()kkkkkxDfsoptvsxfsf（2）当各阶段指标函数为求积关系时，有 111()0(),)()kkkkkxDfstvsxfsf但用的最多的是逆序解法或。1()(),)()kkkkxDnfsoptvsxfsf 1()(),)()0kkkkxDnfsoptvsxfsf2-5 动态规划是模型分类确定型动态规划随机型动态规划离散型动态规划连续型动态规划一共四种类型。其解决的方法是基本思想，基本原理，可以说一种类型，一种方法，它没有像线形规划那

17、样哟普遍一般的方法。具体的例子后面逐步向大家介绍。83 离散确定性动态规划的模型的求解在确定性的动态规划模型中，决策变量分离散和连续两种情况，下面通过一个例子来分别讲述逆序和顺序两种求解方法。例 4某一警卫部门共有 9 支巡逻队，负责 3 个要害部位 A、B、C 的警卫工作，对每个部位可分别派出 2-4 支巡逻队，并且由于派出的巡逻队的不同，各部位预期在一段时期内造成的损失有差别，其具体数字如下：A B C2 18 38 243 14 35 224 10 31 21问：该警卫队应往各部位分别派多少支巡逻队，使总的预期损失为最小。解：把 9 支巡逻队往三个部位派遣看成依次分三个阶段（）1,23

18、k（1）逆序解法：状态变量表示第 k 至第 3 阶段派出的巡逻队数，表示第 k 阶段派出的巡逻队数，ksk=1,2,3，那么状态转移方程，。1kksx(1,23)若用表示第 k 阶段派出的巡逻队数为时，该阶段的部位的损失值，因而，指()kpxk数函数可以写成：。33, 1,31()()kikikki ikVpxpxV设用表示 k 阶段状态为，以此出发采用最优子策略到过程决策时的预期损失值，则 1()()min()kkkkxDf fs先考虑 C 部位派巡逻队，即 k=3，。3334()ixfpf由于问题中只有 3 个要害部位，故第 4 阶段派出的巡逻队对第 3 个部位的损失不再影响

19、，所以有边界条件，那么有。4()0fs33()inxDf因为，又可能取值为（前两个阶段至少用 4 个巡逻队，但至3()2,Ds325s少要留给 C 地区 2 个巡逻队），故3x和2 3 4 3()fs*3x2 24 24 23 24 22 22 34 24 22 21 21 45 24 22 21 21 4再联合考虑对 B，C 两个部位派巡逻队，即 k=2，有。2223()()min()xDfpfs9因为，又，故有以下计算表2(),34Ds257sx和2 3 4 2()fs*2x5 38+22 35+24 59 36 38+21 35+22 31+24 55 47 38+21

20、 35+21 231+22 53 4最后考虑对 A，B，C 三个部位派巡逻队，即 k=1 时，有112()()min()(9xDfpfsf因为，又，故有以下计算表1()2,34Ds9sx和2+7 3+6 4+5 1()fs*1x9 18+53 14+55 10+59 69 3 或 4当 =3 时，； =4 时，。三个部位的巡逻队分别为 3 个，4*1216sx*2*32sx个，2 个，三个部位的预期总损失为 69。当 =4 时，； =3 时，。三个部位的巡逻队分别为 4 个，3*1x215*2*3个，2 个，三个部位的预期总损失为 69。（2）顺序解法阶段编号同逆序法，k 阶段的决

21、策变量为，允许决策集合仍为，根据顺序解kx()kDs法中状态变量的概念，可用于前 3 个部位的巡逻队有 9 支，故有，可用于前（k-1）49个部位的巡逻队数等于可用于 k 个部位的数字减去第 k 阶段派出的巡逻队，即有ks1ks。1kksx由此设本例中（留给部位 C24 人），（第 1 个部位至少要 2 个357s25s巡逻队，至少要给 B，C 留下 4 个巡逻队），由此可写出本例用顺序解法的递推关系式1 1()01()min()kkkkxDfpffs21sx和2 3 4 1()fs*1x2 18+0 18 23 18+0 14+0 14 34 18+0 14+0 10+0

22、10 45 18+0 14+0 10+0 10 41032sx和 2 3 4 23()fs*2x5 38+14 35+18 52 26 38+10 35+14 31+18 48 27 38+10 35+10 231+14 45 3 或 443sx和2 3 4 34()fs*3x9 24+45 22+48 21+52 69 2，三个部位的总预期损失数为 69。*213432,97,43xs例如：以不同的资金投资于不同的项目可创造不同的利润。有一大笔资金如何确定投资项目，使总的收益达到最大也是类似的问题。例：本章例 2，某企业第一年有完好的机器 100 台，可用于 A，B 两类工作，用于 A 工作

23、每台机器的收益是 10 万元，完好率为；用于 B 工作每台机器的收益是 7 万元，机器的23完好率为，试确定三年内如何分配每年用于 A，B 两项工作的机器数，使三年的总收益910最大？解：将三年作为三个阶段，（），状态变量为 k 年初可用于工作的机器的完好台1,23ks数，为第 k 年用于完成 A 任务的机器数，为用于完成 B 任务的机器数，因而有x kx，递推方程和边界条件分别为12997()30103kkkkssxs14(ma()()0kkkkxsf sxfsf当 k=3 时， 3 333 30()a17()a70xs xsf当 k=2 时， 2222 230 220()m

24、()(9ax7310653ssxsf fxsx当 k=1 时111111111010 5029()max73(0)98ax2fsxxx当时，有*1 * *2233920,90;60,sxsxA 0 90 60B 100 0 0三年的总收益 2200 万元。用动态规划方法求解非线形规划问题，12345max,0,(),jsxCtj表示第 k 阶段到第 5 阶段的总和，。ks 5kisx60s表示第 k 阶段的决策值，k=1，2，3，4，5，。kx 6 1()1,()()kkkffsxfs状态转移方程为，1,0,kkkksxxsC5 55650()ma()axxs sff4 4445 4

25、0 0max()sxss令； 24 411(),()2fsxf3 3323 430001()aaax()xsxssff x令，，设可使最小，3()fs231()4fs，使达到最大值，最大值。x3()fs 331(27fs3223 2max()axmax()fs sx令，，设可2()0fs 2211( ()4079ss2s使最小，，使达到最大值，最大值。24x2()fs 421(56fs124 4112121()max()axmax()5656fsfsssx令，，设可043311)()0561s使最小，，使达到最大值，最大值。1()fs1xsc(fs 5

26、1()()cfs2345,5,1,2xcsxcsxc121324354,4,5,1,sxcsxc，。1234cx51234max()cZx134 离散随机性动态规划模型的求解随机性动态规划模型是指状态的转移律是不确定的，即：对给定的状态和决策，下一阶段的到达状态是具有确定概率分布的随机变量，着个概率分布由本阶段的状态和决策完全确定。 2cN12N概率 k 阶段收益1pkskx状态决策k+1 阶段状态 ksN 表示第 k+1 阶段可能的状态数，为给定的状态和决策的情况下，12,Np kskx下一个可能到达状态的概率，为从第 k 阶段转移到 k+1 阶段状态为 i 时的指标函数值。i

27、cks在随机性的动态规划中，由于下一个阶段到达的状态和阶段的效益值不确定，只能把握各阶段期望效益值进行优化。因此，在随机性的动态规划问题中，当指标函数值为各阶段效益值和的情况下，基本方程应该写为：。同1()()max,)()kkkkDfsEvsfs样对多阶段决策问题，边界条件的值应根据问题的具体情况而确定。1(nf例 6某公司承担一种新产品试制任务。合同要求三个月内交出一件合格的样品，否则将负担 1500 元的赔偿费。根据有经验的技术人员估计，试制时每投产一台合格的概率为，投产一批的准备费用为 250 元，每台试制费用为 100 元。若投产一批后全部不合格，13可再投一批试制，但每投一批的

28、周期是一个月。要求确定每批投产多少台，使总的试制费（包括可能发生的赔偿损失）的期望值为最小。解：（1）合同期为三个月，投产一批的周期为一个月，一个月作为一个阶段，故可将整个合同分为三个阶段；（2）状态变量，假定尚没有一个合格品时；已验收到一个以上的合格品时ks 1ks，所以签定合同是有0ks1（3）决策变量表示为每个阶段投产试制的台数：kx141,2 1() 00kkNsDs（4）状态转移方程： 1()( 320)kkxkps未试制成功试制成功（5）第 k 阶段的费用支出为，有()kcx201 (0() =)kkxcx（6）设为状态，决策出发的 k 阶段以后的最小周

29、期的费用，因为()kfskkx，故有(0)kf11()()221min()()(0)33 k kk kk xxkxDfcff当 k=3 时， 30f33 3334()()21)min()1 50xxDfcfsx和0 1 2 3 4 5 3()fx*30 0253150402165070 01 1500 1350 1117 994 946 949 946 4当 k=2 时，，2()f1522 2223()()1)min()(1 946xxDfcfsx和0 1 2 3 4 2()fx*20 0 9463594609650296500 01 946 981 870 830 837 830 3当 k

30、=1 时， 11 111()()2)min()(3 80xxDfcfsx和0 1 2 3 4 5 1()fx*11 830 903 819 796 814 860 796 3即：该合同的最优决策为第一批生产 3 台；如果无合格品，第二批再投产 3 台；如果仍然全部不合格，第三批投产 4 台。这样使中的期望研制费用（包括三批全不合格的赔偿费用）为最小，共计 796 元。165 一般数学规划模型的动态规划解法这里所说的一般数学规划模型包括线性规划、非线性规划、指数规划等。尽管各自的求解方法有很大的差别，但用动态规划的方法来求解时，方法和步骤大体上是相同的，它把依次决定各个变量的取值看成一个多阶段决

31、策问题，因而模型中含有多少个变量就分成多少个阶段求解。约束条件右端的常数项表明可分配的资源数，用状态变量表示约束条件的个数是状态变量的维数，当约束条件增多时，计算工作量明显增大，会出现动态规划的维数障碍，因而限制了动态规划方法的使用。例 7用动态规划方法求解非线性规划问题 23311221max0zxxst解：为用动态规划方法求解，先建立动态规划问题的数学模型把确定的值分别看作两个阶段的决策，用 k 表示阶段序号（k=1,2），状态变量为 k 阶12,x段初约束条件的右端项的剩余值，分别用表示，有12,121323,RxRx动态规划的递推方程为： 1223311202()max()Rf

32、xf边界条件，那么3()f 23220ma1xR令解得221,dRxx212 3xR当，即当，即又因为其二阶导数故达到最大值22()60,dfx2()f123216 () 3fR11121120 3112321111320max()6 ()() 3 ax6+7Rf xfxx19x17由在232211111(6)6()6()2xxxx处无驻点，在处取到最大值。0)9fR由，即，则322111+79 370xxx2140x，二阶导数，取到最大值为。146161()32.745fR两者进行比较可得。故，max29,3.7452.123.60x。这就是这个非线性规划问

33、题的最优解。如果我们代入 Lingo 求213.xR解，其结果是一样的。例 8有一个货船准备装载 N 种货物，已知第 j 种货物的单位质量为，其价值为，假jwjv如该货船的最大载质量为 W，要求确定每种货物的装载件数，在不超过最大载质量允许的前提下，使货船装运物质的总价值最大。解：若用表示第 j 种货物的装载件数，则问题归结为求解下述整数线性规划问题jx11max0,2,NjjjzvwWstx为了用动态规划方法求解，先对此问题建立动态规划模型。将装载 N 种货物看作依次分 N 个阶段完成，用来代表阶段，第 j 阶段的状态可用于第阶(1,2)jN ,1,j段的装载量，用表示，用表示

34、第 j 中物质的件数，则，状态转移可表示jWjxjjWxw为：，由此设动态方程可以表示为：1jjjw 10()ma()jjj jjjxfvf若已知有关数据如下表j 1 2 3j2 3 1jv65 80 3018当 j=3 时，，由于的351Ww3 3340505()max()maxfWf3W取值为 0 到 5，那么3x和0 1 2 3 4 5 3()f*3x0 0 0 01 0 30 30 12 0 30 60 60 23 0 30 60 90 90 34 0 30 60 90 120 120 45 0 30 60 90 120 150 150 5当 j=2 时，，2513Ww2

35、23201()max8()fWfx2x和0 1 *0 0 0 01 0+30 30 02 0+60 60 03 0+90 80+0 90 04 0+120 80+30 120 05 0+150 80+60 150 0当 j=1 时，，12Ww112102()max65()fWfx1x和0 1 2 *15 0+150 65+90 130+30 160 2时，，故，，，。所以1*1221*20x32Wx*3装载的总价值为： max60.z例 8.5用动态规划的逆序解法求解非线性规划问题， 31230(,)iiixst本题分为 3 个阶段，k=1，2，3，表示第 k 个阶段到第 3

36、个阶段的和，为第 k 个阶段kwx决策变量，，，1w1x32x4()f3 334 30022max()maxwwff192 2 223 332000333()max()maxmax()wwwff x1 1 112 100044xxxff故当，，，满足，则42323。12 6例 8.9 （a）2213445123max()()0zxst且为整数，表示第 k 阶段分为 3 个阶段，表示第 k 阶段的取值，1,234kk kx1kksx或其他形式。10()ax()()ksfvfs；5k=4，4sx和0 1 2 3 4 5 4()fs*4x0 25 25 01 25 16

37、25 02 25 16 9 25 03 25 16 9 4 25 04 25 16 9 4 1 25 05 25 16 9 4 1 0 25 03sx和0 1 2 3 4 5 3()fs*3x0 4+25 29 01 4+25 9+25 34 12 4+25 9+25 16+25 41 23 4+25 9+25 16+25 25+25 50 34 4+25 9+25 16+25 25+25 36+25 61 45 4+ 25 9+25 16+25 25+25 36+25 49+25 74 512x0 1 2 3 4 5ma()0 0 1 2 4 62012(,)x(0,)(,1)0(,1)(,

38、2)1(,2)(,3)212s和0 1 2 3 4 5 1()fs*1x25 0+74 0+61 1+50 2+41 4+34 6+29 74 0 0所以变量转移，*1234,5,0,xx1234,0,xx。22ma()()(5)(5)7z(b) 213312max8014zxxst且为整数3sx和0 1 2 3 3()fs*3x0 0 0 01 0 0 02 0 0 03 0 10 10 14 0 10 10 15 0 10 10 16 0 10 20 20 27 0 10 20 20 28 0 10 20 20 29 0 10 20 30 30 310 0 10 20 30 30

39、311 0 10 20 30 30 32sx和0 1 2 2()fs*2x0 0+0 0 01 0+0 0 02 0+0 0 03 0+10 10 04 0+10 20+0 20 15 0+10 20+0 20 16 0+20 20+0 20 17 0+20 20+10 30 18 0+20 20+10 40 40 29 0+30 20+10 40 40 210 0+30 20+20 40 40 1 或 22111 0+30 20+20 40+10 50 21sx和0 1 2 3 4 5 1()fs*1x11 0+50 17+40 32+30 45+20 56+10 65+0 66 4。*12

40、34,max6z22第九章存储论1 引言人们在生产活动或日常生活中往往把需要的物质、食物或用品暂时的储存起来，以备将来使用或消费。这种储存的物品的现象是为了解决供应（或生产）与需求（或消费）之间的不协调的一种手段。（1）战斗，在 1-2 天内要消耗几十万发炮弹，短期生产来不及，只能提前生产储存在军火库中，一旦战争爆发，才能满足需求。（2）水力发电站，-水库的储存-合适的水量-三峡大坝工作的利用（3）生产的储存，-备用物资生产资料（4）商业的储存，- 以库存大量的销售输出之用输入（供应）储存输出（需求）不论是供应还是需求，都存在两个需要考虑的基本问题一是量，即一次供应或需求的量是

41、多少？二是期，什么时候，多长时间？由于一个企业，一个生产单位往往要使用成千上万种不同的物质，并且这些物质的供应（需求）的量和期往往不是均匀的，而且有随机性，这就使储存问题复杂化，需要人们研究如何利用数学工具，将一个实际的问题归结为一种数学模型，然后求出最佳的量和期的数量。这就是储存论所研究的内容。存储物的广义概念：一切暂存在仓库中的材料，在生产过程中的两个阶段之间，上下两个工序之间的制品，生产结束后来集合的产品等均为存储物。据有人估计，美国所有的库存总值超过了一万亿美元，为库存发生的费用每年也在一千亿美元以上，可见研究库存，减少库存费用具有重大的经济意义。存储问题包括的基本要素有：（1）需求

42、率，指单位时间内对某种物品的需求量，以 D 表示。对存储系统来说需求量是输出；在生产过程中上道工序的输出是下道工序输入。输出可以是均匀的，也可以是间断或成批的，需求可以是确定的也可以是随机的。（2）订货批量，订货往往是用以一定数量物品为一批的方式进行，一次订货中包含某种物品的数量称为批量，通常用 Q 表示。（3）订货间隔期，指两次订货之间的时间间隔，以 t 表示。（4）订货提示期，从提出订货到收到货物的时间间隔，用 L 表示。设某种货物的提示期为 10 天，若希望在 3 月 25 日收到这份物品，那么最迟应在 3 月 15 日提前订货。（5）存储（订货）策略：指什么时间提出订货以及订货

43、的数量。例如有：按固定间隔期提出固定数量的订货；按固定间隔期提出最大库存量同现有库存量差值的订货量；当库存量降低到规定水平（保险储备水平或安全存储量）时，提出固定数量或提出最大库存量同现有库存量差值的订货量，等等。与存储问题有关的基本项目有：（1）一次费用或准备结束费用。每组织一次生产、订货或采购某种物品所必须的费用，通常认为与批量的大小无关。一般用表示。DC23（2）存储费用包括仓库保管费、占用流动资金的利息、保险金，存储物的变质损失等，这类费用随存储物的数量改变，以每件存储物在单位时间内所发生的费用计算，用符号表示。pC（3）短缺损失费因存储物已经耗尽，发生供不应求而造成的需求方的经济

44、损失，例如原材料供应不足，造成停工的损失，销售缺货的损失等。以每发生一件短缺物品在单位时间内需求方的损失费用大小来计算，用表示。sC以上项目是存储问题中的主要费用项目。随所分析的实际问题的不同，所考虑的费用项目也有所不同。在一个存储问题中主要考虑：供应（需求）量的多少，简称量的问题；何时供应（需求），简称期的问题。按期和量这两个参数的确定性和随机性，将存储模型分为确定性存储模型与随机性存储模型，下面将分别讨论。242 经济订货批量的存贮模型这里讨论的存贮模型中的期和量的参数都是确定的。所讨论的一种零件或物品的存贮量与同期其他的物品的存储量与其之间不互相影响。这样规定是为了将一个实际存储问题

45、简化便于分析。在生产过程中，往往成批组织成批生产零件和产品，上下工序之间都以成批的零件或产品进行周转，那么批量多大才算经济合理，下面讨论几种典型的模型。2-1 基本的 EOQ 模型例 1设一种物品的需求量 D（件/年）是已知常数，并以一定批量 Q 供应给需求方，提前期为零。这意味着需要这种物品时可以马上得到，并且不允许发生供应短缺，当收到一批物品以后，将其暂存在中间仓库，以速度 D（件/年）消耗掉，这里只考虑两种费用：与有关的费用，需要确定每次订货的批量为多大，是全年总的费用为最小？DCp解：t 时间TQ数量全年的需求量 D，订货批量 Q，全年订货次数，TC-全年的费用，TOC-全年的Dn

46、Q订货费用，TCC-全年的储存费用，，，DTOC 12pTCQ12DpTCOCQ25TC TCTCCTOC QQ*为了求 Q 的值使 TC 达到最小，那么，，210DpCdTQ2*DpC，故当时，TC 达到最小。可见，最优的经济订货批量与230DCdT* 2Q成正比，与成反比。代入得最小的储存费p，21DD pppTCC而此时，。O=2-2 一般的 EOQ 模型例 2在一般的 EOQ 模型中，考虑实际生产部门同需求部门的联系，并允许库存发生短缺的情形。生产部门按一定的速度 P 进行生产，需求部门的需求速度为。生产从()DP0 开始，在时刻内按实际速度增加，然后按速度需求，直至达到最大短缺。1t D从该点又恢复供应，补充上短缺量并开始一个新的生产周期。26库存时间AOMBE1S1t C2t3t42设为最大储存量，为最大短缺量，为开始一个周期的生产准备费用，为单位1S2SD pC产品在单位时间内的存储费，为单位时间产品在单位时间内发生短区的损失费，试确定s总费用为最小的最佳生产批量 Q。解：一个生产周期的时间长度为，分别用表示周期生产的储备1234tt,OCS费、存储费和短缺费。用表示单位时间的平均总费用，则有：，TCD；，12()pCSt234()sSt12341234 1234()()() )DpsSCtStOTtt tt因为

展开阅读全文

第8章 动态规划.doc

第8章动态规划.doc