1、 中图分类号: O221.3 本 科 生 毕 业 论 文 ( 设 计 )( 申 请 学 士 学 位 )论 文 题 目 动 态 规 划 在 经 济 中 的 应用 作 者 姓 名 蒋 兴 龙 专 业 名 称 信 息 与 计 算 科 学 指 导 教 师 王龙芹 2012 年 4 月 28 日学 号:2008211508论文答辩日期:2012 年 月 日指 导 教 师 : (签字)滁州学院本科毕业设计(论文)原创性声明本人郑重声明:所呈交的设计(论文)是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果。本人完全意识到本
2、声明的法律后果由本人承担。作者签名: 年 月 日滁州学院本科毕业论文0目 录摘要 .1Abstract .11. 动态规划相关背景 .32. 动态规划的相关概念 .32.1 基本特征 .32.2 基本概念 .42.3 基本思想 .52.4 动态规划模型的分类和方法 .52.5 动态规划的优缺点 .63. 动态规划的最优化原理和最优性定理 .83.1 最优化原理的概念和证明 .83.2 动态规划的无后效性原理 .84. 动态规划在工业中的应用 .94.1 生产计划问题 .94.2 设备更新问题 .125. 结论 .20参考文献 .20致谢 .21滁州学院本科毕业论文1动态规划摘要:动态规划是运筹
3、学的一个分支,它是解决多阶段决策过程最优化的一种数学方法。所谓“动态” ,指的是在问题的多阶段决策中,按某一顺序,根据每一步所选决策的不同,将随即引起状态的转移,最终在变化的状态中产生一个决策序列。动态规划就是为了使产生的决策序列在符合某种条件下达到最优。动态规划的方法,在工程技术、企业管理、工农业生产及军事等部门中都有广泛的应用,并且获得了显著的效果。在企业管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等,所以它是现代经济管理中的一种重要的决策方法。它的应用也越来越受人重视。本文主要运用动态规划的思想
4、设计出有效的数学模型来解决生产领域中遇到的一些问题,对资源进行优化配置,并规划出最优或可行方案。本文首先对“动态规划”的理论基础进行了讨论。给出了动态规划的基本理论和基本方程,其次给出了最优性定理,并加以证明,最后以工业中最典型的两个问题为例,阐述了动态规划思想基本原理的应用。关键词: 动态规划;最优性原理;经济;生产计划;设备更新中图分类号:O221.3Dynamic ProgrammingAbstract: The dynamic programming is a branch that it is multi-stage decision-making process of solvin
5、g a mathematical optimization method. The so-called “dynamic“ refers to the multi-stage in the decision-making, according to a particular sequence, every step of the decision-making choice, the state will immediately cause the transfer of the final changes in the state have a decision-making sequenc
6、e. Dynamic programming is to make the decision, subject to certain conditions, the optimal sequence. Dynamic Programming methods in engineering technology, enterprise management, industrial and agricultural production and have a wide range of sectors such as military applications. and the effect was
7、 remarkable. In business management, dynamic programming can be used to solve the optimal path, resource allocation, production scheduling, inventory loading, scheduling, and the upgrading of equipment, optimal control 滁州学院本科毕业论文2problems in the production process. So it is an important decision in
8、modern management methods. It has been increasing emphasis on the application. In this paper, dynamic programming, the design of effective ideas to solve the mathematical model produced some of the problems encountered in the field. optimize the allocation of resources and planning the optimal or op
9、tions. This article of the “dynamic planning“ theoretical basis for the discussion. Given the basic theory and the dynamic programming equation, followed by the optimal theorem and prove it. Finally, the two industries most typical example to explain the basic tenets of the Dynamic Programming.Keywo
10、rds: Dynamic programming; Economy; Optimal principle; Production planning; Updating 滁州学院本科毕业论文31 相关背景动态规划是一种可以将复杂问题转化成一系列比较简单的问题的最优方法,其简称 DP 法。它的基本特征是在优化过程中的多阶段性。许多优化问题可以利用动态规划的方法来处理,常有其独特的优越性。特别是对于离散性问题,用数学方法往往难以处理,而动态规划方法则成为解决这些问题一个非常有用的工具。最优化原理是由美国人贝尔曼(Bellman)最先提出来的。最优化原理可以叙述为:“问题整个过程最优策略具有这样的性质
11、:不管前面的状态和策略如何,对于以前的决策所形成的状态而言,余下的所有决策必须构成最优的策略” 。利用最优化原理可以把要处理的多阶段决策问题的求解过程看做是一个连续的递推过程,由前向后或者由后向前逐步推算。在求解中,各个阶段以前的决策和状态,对于其后面子问题来说,只不过是相当于它们的初始条件而已,一般不会影响其后面过程的最优策略。所以,可以把一个问题按阶段分解成为多个相互联系的子问题,而每个子问题均是比原问题简单得多的一个优化问题,并且每个子问题的求解中仅仅只利用它的下一阶段子问题的优化后的结果,经依次求解,最后可以求出原问题的最优解 1。稍微了解了动态规划的背景,下面简单介绍动态规划的一些基
12、本概念和基本方程、动态规划的基本思想、模型的分类及方法以及动态规划的优缺点。2 动态规划的相关概念2.1 基本特征动态规划问题具有下列基本特征:1、整个阶段可以按空间划分,也可以按时间人为划分。动态规划问题具有多阶段决策的特征。2、其每一阶段都有相应的“状态”与之对应,我们把描述状态的量称为“状态变量”。3、其每一阶段都面临一个决策,我们选择不同的决策将会导致下一阶段不同的状态,同时不同的决策将会导致这一阶段不同的目标函数值。滁州学院本科毕业论文44、各子问题与原问题具有完全相同的结构,其每一阶段的最优解问题可以递归地归结为下一阶段各个可能状态的最优解问题。而解决动态规划问题的关键是能否构造这
13、样的递推归结。这种递推归结的过程,称为“不变嵌入”。为了将以上特征形式化,我们提出以下动态规划的基本概念 2。2.2 基本概念1阶段:把所给问题的过程恰当的分成几个相互联系的有顺序的环节,这些环节即称为阶段 。描述阶段的变量成为阶段变量,常用 k 表示。阶段的划分一般是根据空间和时间的自然特征来划分。2.状态:描述了研究问题过程的状况,又称不可控因素,即每个阶段开始所处的自然状态或客观条件。用 表示第 k 阶段的状态变量。这里所说的状态应具有无后效性(即马尔科夫性)。ks3.决策:决策是当过程处于某阶段的某个状态时可做出的选择或决定。决策变量可用表示, 表示第 k 阶段当状态处于 时的决策变量
14、。在实际问题中,决策变量的取值往)(kukuks往限制在某一范围之内,此范围称为允许决策集合。常用 表示第 k 阶段从状态 出发的允)(ksDks许策略集合。有 .)()(kksD4.策略:策略是一个按顺序排列的决策组成的集合。由每段的决策按顺序排列组成的决策函数序列 成为 k 字过程策略,简称子策略,即为 .即)(,)(nkus ,()knps当 k=1 时,此决策函数序列成为全过程的一个策略,简称)(,1, nknk susp策略,记 。)()(21,n5.状态转移方程:若给定第 k 阶段状态变量 的值,如果该阶段的决策变量 一经确定,第 ks kuk+1 阶段的状态变量 的值也就确定,即
15、 的值随 和 的值变化而变化。用方程式表示为 1ks1ku,它描述了由 k 阶段到 k+1 阶段的状态转移规律。此方程是确定过程由一状态),(1kkusF到另一状态的演变过程。6.指标函数和最优指标函数:指标函数具体包括阶段的指标函数和过程的指标函数。阶段指标函数指对应某一阶段和从该阶段出发的一个阶段决策的某种效益量,用 表示。过程指),(kusV标函数指从状态 出发至过程最终,当采取某种子策略时,按预定标准得到的效益值。这个值既ks滁州学院本科毕业论文5与 的状态值有关,又与 以后所选策略有关,它是两者的函数值ksks。最优指标函数,指对某一确定状态选取最优策略后得到的指标函),(1, nk
16、n uuV数值,也是对应某一最优子策略的效益值 。nkkOPTVsf,)(下面我们来了解动态规划的灵魂即它的基本思想。2.3 基本思想1.解决动态规划问题的关键在于正确写出基本的递推关系式和恰当的边界条件,即在每个子问题求解中均利用了它前面子问题的最优化结果,从边界条件开始逐段递推寻优,依次进行,最后一个子问题所得的最优解就是整个问题的最优解。2.每段决策是从全局考虑的,与各段的最优选择答案一般不同。因此在决策过程中,动态规划方法是把当前段和未来各段分开,同时又把当前效益与未来效益结合起来考虑的最优化方法。3.在求整个动态规划问题的最优策略时,由于初始状态已知,而每段的决策都是该段状态的函数,
17、故最优策略所经过的各段最优状态便可逐次变换得到,从而确定了最优策略。利用动态规划解决问题时,往往用到不同的模型及方法,下面作简单介绍。2.4 动态规划模型的分类及方法根据多阶段决策过程的时间变量是连续性的还是离散性的变量,过程分为连续决策过程和离散决策过程。根据决策过程的演变是随机性的还是确定性的,过程又可分为随机型决策过程和确定型决策过程。组合起来就有离散确定型、离散随机型、连续确定型、连续随机型四种决策过程模型。动态规划的方法:动态规划方法有逆序解法和顺序解法之分,那么,他们的动态规划基本方程应如下表述:设指标函数是取各阶段指标的和的形式,既 ,(,)nkiiVsu其中 表示第 i 阶段的
18、指标。他显然是满足指标函数三个性质的。所以上式可写成),(iiusV。当初始状态给定时,过程的策略就被确定,则指标函数就,11, nknknk sv被确定了。因此,指标函数最初状态和策略的函数,可记为 故上面递推关系又可)(,knksPV滁州学院本科毕业论文6写为 其子策略有决策 可看成是由决策, 1, 1,(,)knkkknknVspvsuVsp )(,knsp和 组合而成。即)(u1, 1,()()knkknus如果用 表示初始状态为 的后部子过程所有子策略中的最优子策略。则最优值函数)(,knsps为, ,*,. ,()()()knkknkknkpfVPotVs而 , ,1,1, ,1,
19、 nkkpunknkp usotsotnk 但 )()(,1,1ptfnk所以 边界条件为(,1)( kksDuk fVk ,。1()0nfs上述即为动态规划逆序解法的基本方程,根据边界条件,从 开始,由后向前逆推,从而nk逐步可求得各段的最优决策和相应的最优值,最后求出 时,即得到整个问题的最优解。)(1sf动态规划顺序解法的基本方程:假定阶段序数 k 和状态变量 的定义不变,而改变决策变量 的定义,如取 ,ks kukksu)(1这时的状态转移不是由 去确定 ,而反过来由 去确定 ,则状态转移方程一般形u,1ks,1s式为 ),(1krkuTs因而第 k 阶段的允许决策集合也应作相应的改变,记为 。指标函数也应换成以 和)(1krsD1ks的函数表示。于是可得动态规划顺序解法的基本方程为ku)(),()( 11)(11 kkksDuk fuVoptsfrk n,2边界条件为 式中 。其求解过程,根据边界条件,从 开始,由前0)1,T 1k向后顺推,逐步可求得各段的最优决策和相应的最优值,最后求出 时,就得到整个问题的)(1nsf最优解 4。本论文主要是强调动态规划在经济中的优越性,但是不可否认,动态规划也有其缺点。2.5 动态规划的优缺点动态规划的方法有两个明显的优点,与穷举法相比: