1、统计方法建模,1 多元回归与最优逐步回归 2 主成份分析与相关分析 3 判别分析 4 聚类分析 5 模糊聚类分析 6 马尔可夫链及其应用 7 存贮论,1 多元回归与最优逐步回归,一、数学模型 二、模型的分析与检验 三、回归方程系数的显著性检验 四、回归方程进行预测预报和控制 五、最优逐步回归分析,一、数学模型,设可控或不可控的自变量 ;目标函数,已测得的n组数据为:,其中 是系统的测试数据,相当于如下模型:设多目标系统为:,(1.1),为简化问题,不妨设该系统为单目标系统,且由函数关系 ,可以设:,其中, 为测量误差,相互独立, 。令,(1.2),可得如下线性模型,(1.3),可得,(1.4)
2、,(1.4) 称为线性回归方程的数学模型。,利用最小二乘估计或极大似然估计,令,使 ,由方程组,(1.5),可得系数 的估计。,设 方阵可逆,由模型可得: ,即有,(1.6),可以证明(1.6)与(1.5)是同解方程组的解,它是最优线性无偏估量,满足很多良好的性质,另文补讲。,二、模型的分析与检验,设目标函数 的平均值,,则由公式可计算得总偏差平方和,回归和剩余平方和:,当 被拒绝以后,说明方程(2)中系数不全为零,方程配得合理。否则在被接受以后,说明方程配得不合适,即变量,对目标函数都没有影响,则要从另外因素去考虑该系统。,可以证得:,或者,三、回归方程系数的显著性检验,假设 ,备选假设 ,
3、(1.8),其中 的对角线元素。,当 时,,显著不为零,方程(1.2)中 第 j个变量作用显著。若有某一个系数 假设被接受,则应从方程中剔除。然后从头开始进行一次回归分析工作。,四、回归方程进行预测预报和控制,经过回归分析得到经验回归方程为(1.9)设要在某已知点上进行预测,可得点估计:(1.10)下面对预测预极值进行区间估计,可以证得其中,得 的预测区间:,五、最优逐步回归分析,在线性回归分析中,当经过检验,方程(1.2)作用显著,但 为显著,说明 不起作用,要从方程中剔除出去,一切都要从头算起,很麻烦。这里介绍的方法是光对因子 逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐次引入
4、变量到方程,并及时进行检验,去掉作用不显著的因子,依次循环,到最后无因子可以进入方程,亦无因子被从方程中剔除,这个方法称为最优逐步回归法。从方程(1.2)中,为方便计,设变量个数 ,记 可得(1.12),此时仍可得是回归估计值回归方程为(1.13)分别是 的系数 估计。为了减少误差积累与放大,进行数据中心化标 准化处理:,(1.14)可得数学模型为:(1.15)经推导可得:, ,,称为系数相关矩阵由此可得经验回归方程:(1.16) 然后以变换关系式代入可得,将(17)式与(13)式进行比较,可得:(1.18)只要算得(16)式的 即可。注意到其中 是对于因子 的偏回归平方和,可以证明线性方程中
5、对变量 的多元线性回归方程中 的偏回归平方和为( 是原方程中的偏回归平方和):,把系数矩阵R变成加边矩阵,记为比较 ,设 ,则相应变量 作用最大,但是否显著大,要进行显著性检验,可以证得,当 时,可将变量 引入方程中去。现将这个循环步骤介绍如下: 第一步:挑选第一个因子 对 计算 的偏回归和 找出 决定F检验 当 时引入 ,一般总可以引入的。,第二步:挑选第二个因子首先变换加边矩阵则 , 因子 的偏回归平方和记 决定可否引入,步骤: 1. 对 ,计算 的偏回归平方 和 。2. 找 出中最大的一个,记为 。3. 对 作显著性检验:当 时,要引入 。,第三步:当引入 时, 是否要剔除呢?即已有方程
6、:检验 的偏回归平方和:,当 时因子 不剔除。同样的方法以时因子 不剔除。第四步:重复进行第二步到第三步。一直到没有可引入的新因子,也没有可剔除的因子。最后方程为:(1.19)并把(1.19)式换算成类似的(1.13)式。,2 主成份分析与相关分析,一、数学模型,二、主成份分析,三、主成份的贡献率,这是一个将多个指标化为几个少数指标进行统计分析的问题,设有 维总体有 个随机指标构成一个 维随机向量 ,它的一个实现 为 ;而且这个 指标之间往 往相 互有影响,是否可以将它们综合成少数几个指标 ,使它们尽可能充分反映原 来的 个指标。 例如加工上衣,有袖长、身长、胸围、肩宽、领围、袖口、袖深,等指
7、标,是否可以找出主要几个指标,加工出来就可以了呢?例如主要以衣长、胸宽、型号(肥瘦)这样三个特征。,一、数学模型,设 为 维随机向量, 为 期望向量, 为协方差矩阵,其中设将 综合成很少几个综合性指标, 如 ,不妨设,则有要使 尽可能反映原来的指标的作用,则要使 尽可能大,可以利用 乘子法:要对a加以限制 否则加大 , 增大无意义。令设 并使,可得方程组(2.1)的解为(2.2) 以 左乘(2.2)之两边,得 即 由(2.2)式可得(2.3) 要使满足(2.3)的a非零,应有,即入是 的特征根,设 是 的 个特征根,只要取 ,再由 ,求出V的属于 的特征向量 ,在条件 是唯一的 维特征向量 。
8、于是得(2.4),二、主成份分析,一般协方差方阵为非负定,对角线上各阶主子式都大于等于零,即特征值有:设前m个都大于零,依次为 ,相应的特征向量为 ,则,即为第一,第二,第 个主成份,由线性代数知识可知,不同的特征根对应的不同的特征向量线性无关,由于V是实对称阵,则 ,变换后的各主成份 相互无关。即对 进行了一次正交变换。,在实际应用中,V阵往往是未知的,需要用V的估计 值来代替 ,设有 组观测值则取 (2.5)(2.6)其中 是 的 子样方差, 的子样协方差。需要求出 的特征值。,由于不同的度量会产生量纲问题,一般建议作如下变换:用标准变量 代替以前的 ,即可以运算。此时的协方差矩阵即相关矩
9、阵从R出发,可求主成份。,三、主成份的贡献率,为了尽可能以少数几个主成份 来代替P个指标 ,那么要决定取多少个主成份才够呢由于 则可得 是 的方差,可得亦是V的全部特征值之和:,由于 , 则令 表明方差 在全部 方差中所占的比重,称 是第i个主成份的贡献率,显然有 ,不妨取一个阈值为d(0d1),当 时,即舍去,此时可取 为主成份。以贡献率来决定它的个数。,一、数学模型,二、关于计算中应注意的问题,三、关于误判率及多个总体的判别,3 判别分析,一、数学模型,根据所研究的个体的观察指标来推断个体所属于何种类型的一种统计分析方法,称为判别分析。例如某精神病院有精神病患者256名,诊断结果将它们分成
10、六类 (相当于6个总体)设 服从三维联合正态分布 i=1,2,6,其中, 为协方差矩阵,一般这六种类型可分为焦虑状、癔病、精神病、强迫观念型、变态人格、正常,若有如下子样:子样 子样 子样,注意到每个子样 都是三维向量。现有一个新的精神病患者前来就医,测得三个指标:,试判断该患者病情属于哪一类。,(一) 两点的距离,设 维空间中有两点 , 则其欧氏距离为 :,(3.1),由于数据的量纲不同,不采用欧氏距离, 用马氏距离有:定义1:设X,Y是从总体G中抽取的样品,G服从P维正态分布, , 定义X,Y两点间的距离为马氏距离:,(3.2),定义2:X与总体G的距离为D(X,G)为,(3.3),(二)
11、距离判别法设有两个协方差相同的正态总体 ,且,对于一个新的样品,要判定它来自哪一个总体,有一个很直观的方法:计算,若,(三)线性判别函数由,令,记,则有:当 时, 否则,当 为已知时,令,, 可得:,(3.4),称 为线性判别函数,a为判别系数,因为,,即,解线性方程组可得解,此时的判别规则为:,X是新的一个点,将其代入即可判别。,(3.5),二、关于计算中应注意的问题,实际上,均未知,要用样本值的估计公式来计算出,。其方法如下:,设子样,来自总体,子样,来自,可由,(在本节的开头的例子中P=3),得到,(3.6),(3.7),判别函数为,(3.8),判别系数为,三、关于误判率及多个总体的判别
12、,这里提及一个回报的误判率问题。在构造判别函数W(X)时,是依据样本,现在已知,均属于,从道理上来说,经过判别公式(8),可得出,但也可能出来某几个不属于,这,便是误判。若有 存在,使得,说明,这就产生了一个误判。所谓误判率,即是出现误判的百分数,我们应该有所控制。当两个总体的协方差不相等时,可用如下方法:,(3.9),(3.10),当,当,未知时,用下列估计代替:,在,个总体,时,均值为,协方差阵为,(,维),设,都已知时,X为样品,计算,选择一个,最小的值例如,则,设,未知,但独立,可以分别以估计值来计算。,当上述 未知,但,亦可以用上述类似方法。上述解决方法中,可以扩展到非正态分布。,时
13、,,4 聚类分析,物以类聚,人以群分,社会发展和科技的进步都要求对于某些物体进行分类。由于早期的定性分类已不能满足需要,于是数值分类学便应运而生。,一、数学模型,二、应用类例,一、数学模型,某种物品有n个:,指标,如何将其分成若干类,基本的思路是把距离较近的点归成一类。这里的距离可分为如下三类:,它有m个数值量化,1.距离,的距离,本文中的距离常用欧氏或马氏距离,公式在前几节中已述,还有一种用绝对距离:,应该提及马氏距离,可以克服数据相关性的困难 。,2.数据正规化处理,当,的分量中,大,要经过正规化标准化处理,令,个指标量纲不一致时,相差很,(4.1),其中,(4.2),(4.3),将经过(
14、1)式处理的数据,重新视作,(为记号上的方便),3. 相似系数法,的相关系数,(4.4),可以将相关愈密切的归成一类。,4.最短距离聚类法(系统聚类法, 逐步并类法),先将n个样本各自为一类,计算它们之间的距离,选择距离小的二个样本归为一个新类,再计算这个新类与其它样本的距离,选择距离小的二个样本(或二个新类)归为一个新类,每次合并缩小一个以上的类,直到所有样本都划为一个类为止。这里规定两点间距离为:,两类间的距离,即,的距离为:,步骤如下:1.数据正规化处理要视各指标的量纲是否一致,相差是否太大,并选择一种距离计算法,为了方便计,一般都选择欧氏距离法。2.计算各样本间的两两距离,并记在分类距
15、离对称表中,并记为D(0),第0步分类,此时,(每一个样本点为一个类),3.选择表D(0)中的最短距离,设为,则将,合并成一个新类,记为,(4.5),4.计算新类,与其它类之间的距离,定义,(4.6),表示新类,与类,之间的距离。,5.作D(1)表,将D(0)中的第p,q行和p,q列删去,加上第r行,第r列。第r行,第r列与其它类的距离按(4.6)式判断后记上,这样得到一个新的分类距离对称表,并 记为D(1), D(1)表示经过一次聚类后的距离表,要注意的是Dr类是由哪两类聚类得到应在D(1)表下给以说明。6.对D(1)按3,4,5重复类似D(0)的聚类工作,得D(2)。7.一直重复,直到最后
16、只剩下两类为止,并作聚类图。,二、应用类例,现有8个样品,每个样品有2个指标(m=2,2维变量),它们的量纲相同,(否则要经过正规化处理),试用系统聚类方法对这8个样品进行聚类。,解:采用欧氏距离(1)最短距离法,首先用表格形式列出D(0),表示第i个样品,i=1,2,8,在D(0)中,最小值是1.0,相应的距离是D(3.4),与D(6,7)。则,合并为新类,把,合并成,。,(2)把D(0)中去掉,并计算得下表,后两行重算,其余照D(0)照抄。,视D(1)中,最小值为1.4, 相应的是D(5,10)将,合并成新类,。,3)同法构造D(2)表,其中,最小值D(1,2)=D(2,9)=2.0,则把
17、,,在D(2)中,其中,D(3)中,最小值D(11,12)=4.1, 因此把,,在,(见D(0)第8行),3.把上述聚类过程用聚类图表示:,说明:聚类到一定程度即可结束,一般可以选取一个阈值T,到D(K)中的所有非零元素都大于T,即结束(表中的值T值)设T=2.5:则到D(3)时结束,此时的共聚为三类:,如下图:,5 模糊聚类分析,二、数学模型,一、问题的提出,三、一个实例,一、问题的提出,客观事物分成确定性和不确定性两类,处理不确定性的方法为随机数学方法。在进行随机现象的研究时,所表现的现象是不确定的,但对象事物本身是确定的。例如投一个分币,出现哪一面是随机的,但分币本身是确定的。如果所研究
18、的事物本身是不确定的,这就是模糊数学所研究的范畴。例如,一个人年龄大了,称年老,年小,或年青,但到底什么算年老,什么算年青呢?又如儿子象父亲,什么是象?象多少?再说儿子象父亲,儿子又象母亲(部分象),难道父亲象母亲? 1965年由I.A.Zadeh提出模糊数学,它可以广泛地应于图象识别,聚类分析,计算机应用和社会科学。,例如洗衣机和空调器已用上模糊控制,本节将把模糊数学的一套方法引入聚类分析中来,称为模糊聚类分析。,二、数学模型,设E为分明集(集合) 1.定义: 称为隶属度函数(分得很清楚)要末是,要末不是对A为不分明集, 可以取0到1之间的任意一个实数值.当 愈接近于1.则 的程度愈大. 愈
19、接近于0.则的程度愈小.,2.模糊数学的运算法则如A和B为不分明集,则有:并,记为 , 交,记 , 补,记为 ,3.模糊聚类模糊聚类同于一般聚类法(相似系数法或最小距离法)以相似系数(相关系数)法为例:思路: 先算相似系数矩阵(相似矩阵)将相似矩阵改造成模糊矩阵:即将原相似矩 阵的元素压缩到0,1之间改造成模糊等价矩阵,取不同的标准,可以得到不同的聚类标准.,计算步骤:第一步:计算相似的系数先将 数据 标准化令得到标准化的数据为 显然 (标准化数据的平均值一定为0)得标准化后比数据的相关系数为,相似矩阵 第二步:将相似系数压缩到0,1之间令 建立模糊矩阵,第三步:建立模糊等价矩阵由于上述模糊矩
20、阵不具有传递性:即要通过褶积将模糊矩阵改造成模糊等价矩阵:矩阵的褶积与矩阵乘法类似,只是将数的加. 乘运算改成并 和交 :则褶积为:,于是有: 于是有:一直到 为止 此时 即满足模糊等价矩阵,具有传递性此时记它为:CR 第四步:进行聚类:将矩阵CR的元素 依大小次序排列,从1开始,沿着 自大到小依次取 值,定义:可以得到若干个0,1元素构成的CR 矩阵,其中之1的表示这二个样本划为一类,三、一个实例=-上海4月平均气温; -北京3月雨量-5月地磁指数; -5月500毫巴W型环流型日数予报对象:华北五站(北京、天津、营口、太原、石家庄)7-8月降水量,仅用61-67年 7年的资料(略) 第一步:
21、计算相似系数经过标准化计算相似系数矩阵R,第二步:建立模糊矩阵将相似系数压缩到0,1之间 得第三步:建立模糊等价矩阵按上式计算: 例如,得到 , 发现 , 当 取0.92时:将 ,当 取0.65时有:,又将 合并成一类, 当 取0.64时,有此时将1,3,再与4,6并为一类,可分成三类 再 取=0.63时这次再将 ,只有二类: ,聚类图:,说明:(1)当 =0.65时,共分成四类: (2)当 =0.64时,共分成三类: (3)当 =0.63时,共分成二类: 这是以按年份为基本类的分类图,0.64,0.65,0.92,0.99,0.63,6 马尔可夫链及其应用,一、随机过程,二、马尔可夫方程和,
22、步转移矩阵,三、遍历性与平稳分布,四、马氏链的应用,一、随机过程描述一种随机现象的变量,一般称为随机变量,记为 ,而随着时间参数t或其它参数变化而变化的随机变量,称为随机过程。定义1 在给定的概率空间( ,F,P)及实数集T,其中 为样本空间,F为分布函数,P为概率, 对于每一个 , 有定义在( ,F,P)上的随机变量 与之对应,则称为 随机过程,一般简化为 。,定义2 (马尔可夫过程) 设随机过程 ,如果在已知时间t系统处于状态x的条件下,在时刻 ( t)系统所处状态和时刻t以前所处的状态无关,则称 为马尔可夫过程。从定义2可知马氏过程只与t时刻有关,与t时刻以前无关。定义3 (马尔可夫链)
23、 设随机过程 只能取可列个值 把 称为在时刻 系统处于状态 若在已知时刻 系统处于 状态的条件下,在时刻 ( ) 系统所处的状态情况与t时刻以前所处状态无关,则称 为时间连续,状态离散的马氏过程。而状态的转移只能在 发生的马氏过程称为马尔可夫链。从定义3可知,马氏链是状态离散,时间离散的马尔可夫过程。,定义4 (转移概率) 设系统的离散状态为 设 表示第 次转移到状态 表示系统开始处于 状态。则称 (6.1) 为系统在k-1次转移到 状态,而第k次转移到 状态的转移概率 由定义可知 (6.2)定义5 若(2)式中 有:(6.3) 则称为均匀马氏链 (与第几次转移无关)即,定义6 转移概率与转移
24、矩阵令转移概率 为矩阵 的第 行,第j列元素则有(6.4)称为马氏链的转移矩阵,其中,例:一个分子在两个附着壁之间的随机游动,如图1所示(1) 这个分子在x轴上1,2,S的位置上任意一点,且只能在这S个位置上.(2)当分子在1与S两端点时,分子被吸收,不再游动(吸收壁)(3)分子每转移一次,只移动一步,且必须移动若时刻时,分子在i处( ),在一个单位时间后它转移到i+1点处的概率为P(向右移动),它转移到i-1点处的概率为 向左移动)。问:在初始位置于i处,经过5次转移它落在j处的概率是多少?,满足以下条件:,分析:该系统的转移概率为:这个均匀马氏链系统的转移矩阵为,二、马尔可夫方程和n步转移
25、矩阵设 表示一个均匀马氏链经过n步转移由状态 转移到状态 的转移概率,当 时 讨论 (二步转移) 令 事件B=“系统经由二次转移,由 转移到 ”=“系统由 转移到 ,再由 转移到 ” k=1,2, 因此, 两两互不相容事件(只与状态 时的时刻有关) 类似可证:(6.5),(5)式称切普曼一柯尔莫哥洛夫方程由代数知识:A=可见,于是 (6.6)类似可证得 (6.7)上例要求 : 只要 例 这个元素的值即可.,三、遍历性与平稳分布定义7 设 为均匀马氏链(与第n次转移无关),对一切状态i及j(或称 ,存在不依赖于i的常数,使得(6.8)则称均匀马氏链有遍历性 遍历意义: 遍历性说明不论系统自那一个
26、状态出发,当转移次数n充分大时,转移到 状态的概率近似于某个常数 。,定理1:对有限个状态的均匀马氏链 ,若存在一正整数 ,使对一切 有(6.9) 则此马氏链是遍历的且(8)中的 是如下方程组(6.10)在条件 下的唯一解证 略,定义8 (平稳性):设 为有限s个状态的均匀马氏链,若初始概率 满足全概率公式:则称 为平稳的, 称为 的一个平稳分布表示第k次 转移到状态的绝对概率为初始状态概率可以证明: 结论: 当马氏链是平稳时,初始概率等于绝对概率 平稳均匀马氏链在任一时刻处于状态 的概率都相等,说明平稳。,设 二次转移矩阵为则 对任意 说明是遍历的。由定理1可知: 马氏链是平稳的即有:,例2
27、:例1一样: 没有附着壁的随机游动其余同例1,由 :得 当 时,游动时前进一步与后退一步是等可能的,说明系统处于任一状态的概率明显相等,四、马氏链的应用 应用题1: 机器生产零件时,机器处于两种可能状态的:=“可调整状态”-称良好状态=“不可调整状态”-称不良状态 机器使用一天,它的转移概率为 问:在n天以后机器处于不良状态,良好状态的概率为多少?若有100台机器: 问配备多少个机修工人才能使机器待修的可能性至多为10%?(一天工人可以修理2台机器),解: 即 该系统是均匀马氏链,且为遍历:可设 由定理1:知解方程组,答: 不管各台机器处于什么状态,到n天以后,机器处于良好状态为 ,处于不良状
28、态为由于机器处于不良状态的概率为 ,设n天后,100台机器中有 台处于不良状态并设配备m个维修工人,即一天可修理 台机器:利用泊松分布,得 ,可以泊松分布表, 决定,应用题2:是否要进行咔啡推销广告的决策为增加咔啡的推销,打算进行一次广告宣传,需要支付全部广告费用600万元,假设国内喝咔啡总人数为5000万,增加一个饮用本公司的咔啡的顾客,本公司可获利2元,通过广泛的社会调查(调查费用包括在广告费用中),知登广告之前顾客改变牌子概率为:,到,在登了广告之后顾客改变牌子的概率为,到,问:从经济效益的角度决定要否做这个广告?,解: 易知上述系统可以看成随机游动,且是遍历的,因而是平稳马氏链,存在着
29、利用即较长时间以后,采用我公司牌子概率为0.5 同法可得:, 做了广告以后,采用我厂的牌子的概率为0.6N=5000万 N0.6N0.5=500万0.1=500万 答: 在做了广告以后,平均可增加顾告500万获利500万2元=1000万元 广告费600万元 纯利润1000万-600万=400万 决策:可以进行该项广告。,参考文献: 1 复旦大学数学系 概率论与数理统计 高教出版社 1985 2 中山大学概率统计系 概率论与数理统计 高教出版社 1984 3 范大茵,陈永华 概率论与数理统计 浙江大学出版社 1996 4 陈希孺 概率论与数理统计 中国科技大学出版社 1993 5 沈凤麟,钱玉姜
30、 信号统计分析基础 中国科技大学出版社 1989 6 概率统计与随机过程 武汉大学出版社 7 中国现场统计研究会三次设计组,全国总工会电教中心 正交法和三次设计 科学出版社 1985 8 陈兆能等 试验分析与设计 上海交通大学出版社 1991 9 韩之俊,章谓基 质量工程学 科学出版社 1991,7 存贮论,在日常的生产和生活中存在着大量存贮现象。例如企业要有一定数量的原料存在仓库中,以便生产的进行,商店要有一定量的商品存在仓库中,以便销售,不致于经常缺货,等等。库存量的多少直接影响到企业的效益,库存过少则使生产或销售发生中断,减少了利润;库存量过大,又会造成积压,增加成本。因此,合理的存贮策
31、略具有重要的经济意义。 存贮论是研究存贮问题的理论和方法的一门学科。它用定量的方法描述存贮状态,补充和需求,描述存贮状态与费用间关系,并确定合理的补充策略。建立存贮模型的三个环节是补充策略,费用函数和经济批量算式。,存贮系统包含三个主要内容即补充、存贮状态和需求,如图示 :,补充,存贮状态,需 求,一般地需求是外在的,不受人的控制,存贮状态由需求和补充决定。因此人们的决策对象只有补充。如何根据需求和仓库容量、费用等约束条件,确定补充策略使费用目标最小,这是存贮论研究的主要问题。,补充策略通常有三种:即T循环策略,T,S补充策略和T,S,S补充策略。T循环策略是指当需求速度不变,补充时间为零的情
32、况下,每隔时间T补充一次,每次补充批量Q。,T,S补充策略是指在需求速度变化,补充时间为0的情况下,每隔T时间盘点一次,并及时补充,每次补充到存贮水平S。因此每次补充量 是变量, , 是盘点时的存量。T,S,S策略是指每隔T时间盘点一次,规定一个存贮保险量S,当存量不小于S时不补充,当存量小于S时才补充,补充到定额水平 ( )。,研究存贮问题的目的是为了选用最优的存贮策略(何时补充?补充多少?)使得存贮费用最小。一般要考虑的费用包括存贮费(仓库管理费用,存贮设备费用,保险费,利率等),订货量(货物价格,运费和订购费),生产费,当货物由自己生产时就没有了订货费,而代之以生产费,包括生产的固定费用
33、和可变费用。缺货损失费,因存贮不足所产生的费用,如收益的损失,停工损失,延误交货罚款等,费用函数由上述费用构成。,在补充策略和费用函数确定后,就要求出使费用最小的订货批量Q,一般称经济批量,经济批量算式是最佳批量Q的数学表达式。 下面我们来讨论各种情况下的存贮模型 :,一、连续盘点,均匀需求的确定性存贮模型二、定期盘点,需求变化的情况三、单周期随机存贮模型四、多周期随机存贮模型,一、连续盘点,均匀需求的确定性存贮模型,我们假定需求速度不变,补充采取T循环策略的问题 模型1 经典的批量模型我们假定(i)不允许缺货(ii)需求速度为d(iii)补充时间为0(iv)订购费或生产的固定费用为a,单位货
34、物单位时间的存贮费为h,考虑在一个周期T内的费用(我们不考虑货物本身费用,因为不影响我们的计算)令时刻的存贮量,T=Q/d 费用订购费存贮费,(8.1),在一个单位时间内的费用是一个周期内费用与周期数,的积,,,得 :,(8.2),这是最优批量,而两次补充的最佳周期为,单位时间的极小费用为,如考虑货物本身成本,则,为单位货物成本。,模型2 连续补充的经济批量模型如果物品是厂内生产,而不是外购的,则出现连续补充的情况,即补充是以速度 进行的,这里 。设初始存贮状态 ,在 内补充以速度 进行, ,则最大存贮量为,在 以后我们停止补充,直到存贮量降到0,这作为一个周期。以后再重复上述补充办法,周期T
35、为,在一个周期内费用为,因此单位时间的费用为,令,,解得,经济批量,最佳周期,最小费用,最佳生产时间,模型3 允许缺货的经济批量模型与模型1比较,我们去掉了模型1中的条件(i),其余条件不变。设初始存贮量y(0)=S,经过时间S/d,下降为0,但还不补充,出现缺货现象,直到时间T时补充一个批量,单位货物单位时间的缺货损失为b。这里T=Q/d在s/d,T中存贮量为0,但我们假设在这段时间内,我们仍把货物卖掉,但尚未发出,而在补充了批量Q后,把货物发出,这样存贮量恢复到S,而QS则是欠货部分。,由于缺货,因此须支付损失费,以补偿对方的损失,一个周期内的费用为单位时间内的费用为现有两个变量,一是批量
36、Q,二是S。令得,解得方程组最大缺货量,模型4 有批发折扣的经济批量模型现在我们考虑有批发折扣的问题,其余条件同模型1 设货物的单位成本与订货量 有如下关系货物的单位成本是 。代表价格折扣的分界点, 一般有当不考虑货物本身的成本时,单位时间费用为(见模型1),现考虑货物本身的成本,则在不考虑批发折扣的因素时,最佳批量为在考虑批发折扣的因素时, 。因为 , 则 不变或更大,即使 不变,由模型1知费用也会增加,因此 必使费用增加。当 时,若 不变也会使费用增加,若 变小,则有 增加,但 变小,因此 只能取 这样我们就能确定最佳批量 ,,先求出 ,并确定 ,使 此时的总费用为再求出 比较 ,找到使总
37、费用最小的批量 这时的Q就是最佳订货批量。,二、定期盘点,需求变化的情况前面所述的各个模型都有一个要求,即需求速度不变,现在如果需求速度变化,则情况怎样呢?,设在计划期内,分成n个相等的阶段,每个阶段的需求速度不同,分别为 ,两阶段的间隔时间为T,不允许缺货。现按两种不同的补充策略来讨论。1. T, S补充策略按时间间隔T定期盘点,并及时补充,每次的补充量将存贮量恢复到定额水平S,则在计划期间的总费用为为了保证不缺货,则,所以 令 各个阶段的订货量分别为 2. T, S, S策略 在这里我们通过一个例子来说明解此类问题的方法 例:某鞋店出售橡胶雪靴。过去的经验表明销售旺季只有6个月,从10月1
38、日到3月31日,商店对明年的需求预测如下:,雪靴进价每双4元,但供应者只依整批供应,每批10, 20, 30, 40, 50或60双,每批定货提供批发折扣,每次订货费10元,每双雪靴每月存贮费0.2元,且热销季节前后存贮都为0,假定每月需求是常数,存贮费按月存贮量计算,求使总费用最小的订货方案。 解 本题中无存贮限制,每月补充量可以只满足本月需求,也可以满足以后几个月的需求,以后可以补充,也可以不补充,这样由于情况复杂,用前面的方法求解有困难,但我们可以用动态规划的方法来求解。,则状态转移方程为阶段效益函数为这里 月的订货费用,包括 订购费和货物成本,动态规划基本方程,根据动态规划基本方程,我
39、们经计算可得如下结果,所以,这样就得最优补充策略最小总费用,三、单周期随机存贮模型前面我们考虑的是需求是确定的情形,但在很多情况下需求实际上是随机的。现在我们来考虑需求随机的问题,这里我们考虑的是在需求过程中只进一次货的情况,这种情况适用于季节性强,更新快,不易保存的商品如报纸就是一个典型例子。这时的问题是如何确定适当的订货量Q,因为订货太多,销售不完就必须处理掉,造成损失;而订货太少又会造成缺货损失。表示每单位商品的成本S表示每单位商品的售价v表示当销售不掉时,每单位商品的处理价,且v可正可负订货量 a订购费用h单位商品缺货损失P单位商品缺货损失,需求量,是一个随机变量需求量X的概率 下面我
40、们建立利润函数,这里销售期为 ,销售速度均匀,因此期望利润,现在要求出 ,使 极大,由于 是离散的,不能用求导数的方法,但我们可以仿照进行。,令令 则得,(8.3),上式是 和 离散的时候的结果,若 和 是连续的,设 的密度函数为 ,则得,令得(8.4)解(8.3)和(8.4)就可得到使EC(Q)达到极大时的Q值,四、多周期随机存贮模型现在我们考虑订货不是一次的随机存贮模型,我们假定(i)补充库存有一个交货时间,即从订单发出到到货的时间用 表示, 是固定的。(ii)在计划期 内,总需求量的期望为0,其中在交货时间 内,需求量为 ,密度为 , ,因此,(iii)补充策略是当存贮水平下降到订货点
41、时就开始订货,订货量 ,每次订购费 。,(iV)虽然当订单发出时,库存还有 ,但订货需要时间为 ,由于需求随机,仍可能出现缺货,单位商品缺货损失为 元,缺货可以在到货后一次补上,也可以不再供应。,设初始存贮量为 ,求费用函数。费用我们用计划期内期望费用代之,记作 。费用包括订购费 ,缺货损失 和存贮费 ,因此(1) 订购费 已知每次的订购费为 ,总期望需求量 ,订期批 量 ,则期望订货次数 。(2) 缺货损失 缺货只发生于交货时间 内,在这设时间内开始有存货,需求为 。因此缺货量的期望值为(8.5),计划期内的期望缺货损失为(3)存贮费我们假定需求速度是线性的,计划期内各周期的存贮状态平均化,若缺货以后补上,则存贮费用为若缺货不再供应,则当 时,剩余存贮量当 时,剩余存贮量0,因此期望剩余存贮量为(8.6)存贮费用为,现在可得总的费用函数 1.缺货后补上的情形(8.7)2.缺货后不再供应的情形,最后通过迭代求出 和令B(S)=0 得以此类推,进行迭代直到求出 和 。在实际问题中, 时间内的需求量 常服从正态分布,我们在这种情形下求出B(S),,令 则这里, 这样迭代就会方便一些。,