1、第四章 系统预测,第一节 系统预测概述一、系统预测的概念与实质二、预测方法分类三、系统预测的一般步骤第二节 定性预测方法第三节 时间序列分析一、时间序列分析的概念二、平滑预测法第四节 回归分析预测法,第一节 系统预测概述,一、预测的概念与实质“凡事预则立,不预则废”“人无远虑,必有近忧”,一个例子,背景案例1989年7月,史玉柱的M-6401桌面排版印刷系统软件,开始申请在计算机世界做广告,收到巨大效果,11月,史玉柱从4000元起家,一跃成为默默发财的百万富翁1990年1月,他注册了“巨人”公司,并推出了M-6402文字处理软件系列产品一年后,巨人已发展成资本金超过1亿元的高科技公司。巨人的
2、年度销售商大会是全国规模最大的电脑盛会。1992年,巨人已赫然成为中国电脑行业的领头军,1992年,史玉柱决定建造巨人大厦,计划盖38层,大部分自用,并没有搞房地产的设想。这年下半年,一位重要领导来巨人视察,当他被引到巨人大厦工地参观时,四周环顾,便兴致十分高昂地对史玉柱说:这座楼的位置十分好,为什么不盖得更高一点?就是这句话,让史玉柱改变了主意。巨人大厦的设计从38层升高到54层。1994年初,又一位领导人要来视察巨人。细心的人突然注意到,“4”这个数字好像很不吉利,领导会不会不高兴?于是马上给香港的设计单位打电话,索性定在了70层。建筑预算陡增了12亿元,工期将要延长6年。,1996年9月
3、,耗尽巨人精血的大厦地下工程完成,也就在此时巨人的财务危机全面爆发。史玉柱被迫抽调保健品的流动资金救急。保健品方面因此由盛转衰。1997年初,巨人大厦未按期完成,国内楼花购买者纷纷要求退款。不久,大厦停工,巨人名存实亡。,巨人失误的原因之一,巨人的决策机制难以适应企业的发展。史玉柱的个人股份占90%,其他几位老总都没有股份。总裁办公会可以影响其决策,但基本上是其本人说了算案例启示:预测是决策的依据,可以减少决策的随意性,1、预测的概念,预测:根据客观事物(如现存系统或拟建系统)的过去和现在的发展规律,借助科学的方法和手段,对其未来的发展趋势和状况进行描述、分析,形成科学的假设和判断,2. 系统
4、预测的实质,充分分析、理解系统发展变化的规律,根据系统的过去和现在估计未来,根据已知推测未知,从而减少对未来事物认识的不确定性,以指导我们的决策行动,减少决策的盲目性。,3. 系统预测的意义,预测为决策服务预测为规划服务,二、预测及预测方法分类,1 预测分类:按涉及的领域分:社会预测科学预测技术预测经济预测军事预测等,(1)经济预测,经济预测:一种研究经济未来发展的活动,通过定性和定量的方法,调查经济发展的历史和现状,研究其发展的规律,分析和预计在未来一段期限内的经济发展趋势和状况,为制定经济发展目标、规划与计划以及管理服务。分类:宏观经济预测、微观经济预测 短期、中期、长期预测,(2)科学技
5、术预测,科学技术预测:是分析和推测科学技术的未来发展趋势、方向和状况,为科学技术的规划、决策和管理服务。,科学预测的分类,(3)系统预测,经济预测和科学技术预测,都可以看作系统预测。系统预测:是指对系统工程研究的对象进行的预测。系统预测与系统的性质相联系。,2、预测方法分类,第一类:定性预测方法。主要是依据人们对系统过去和现在的经验、判断和直觉,如市场调查、专家打分、主观评价等作出预测。主要有特尔斐(Delphi)法、主观概率法、领先指标法等。,第二类:时间序列分析预测方法。主要是根据统计对象统对象随时间变化的历史资料(如统计数据、实验数据和变化趋势等),只考虑系统变量随时间的发展变化规律,对
6、其未来作出预测。它主要包括移动平均法、指数平滑法、趋势外推等。,2、预测方法分类,第三类:因果关系预测方法。系统变量之间存在着某种前因后果关系,找出影响某种结果的一个或几个因素,建立起它们之间的数学模型,然后可以根据自变量的变化预测结果变量的变化。因果关系模型中的因变量和自变量在时间上是同步的,即因变量的预测值要由并进酌自变量的值来旁推。主要有线性回归分析法、马尔可夫(Markov)法、状态空间预测法、计量经济预测法以及系统动力学仿真方法等。,2、预测方法分类,三、系统预测的一般步骤,1、系统预测技术应当包括的要素(1)它所遵循的理论;(2)预测对象的历史和现状资料与数据;(3)所能采用的计算
7、方法或分析判断方法;(4)预测方法和结果的评价与检验等要素。,时间、数据、模型、费用、精度、实用性,预测技术所遵循的理论又包括两个方面:一是预测对象本身所处学科领域的理论,用以辨识事物发展的客观规律,指导预测方法的选择和结果的分析检验,例如天气预报和经济预报可能采用完全不同的预测模型二是预测方法本身的理论,主要是数理统计学的一些有关理论,近来也出现了一些智能预测的理论和方法等。,2、预测的步骤,l 明确预测目的2收集、整理资料和数据3建立预测模型4模型参数估计5模型检验6预测实施与结果分析,第二节 定性预测方法,定性预测是以人的逻辑判断为主,并根据由各种途径得到的意见、信息和有关资料,综合分析
8、当前的政治、经济、科技等形势以及预测对象的内在联系,以判断事件发展的前景,并尽量把这种判断转化为可计量的预测。定性预测法一船适应于缺乏历史统计数据的系统对象。特尔斐法(Delphi法),优点:方法简单,预测迅速缺点:统一忽略某些因素影响,数量概念较差。,一、专家调查法,二、特尔斐法(Delphi法),特尔斐方法是美国“兰德”公司于1964年首先用于技术预测的。特尔斐(DelPhi)是古希腊传说中的神颠之地,城小有座阿波罗神殿可以预测未来,因而借用其名。特尔斐法是专家会议调查法的一种发展。它以匿名方式通过几轮函询,征求专家意见。预测领导小组对每一轮的意见都进行汇总整理,作为参考资料再发给每个专家
9、,供他们分析判断,提出新的论证。如此多次反复,专家意见日趋一致,结论的可靠性越来越大。特尔斐法曾在七八十年代成为主要的预测方法,得到了广泛的应用。,主要体现在以下:专家的选择预测问题预测过程应遵守的原则结果的处理和表达方式,1、特尔斐方法的特点,1、特尔斐方法的特点,(1) 特尔斐方法采用匿名形式选择专家 (2)特尔斐法不同于民意测验,一般要经过四轮。 (3)作定量处理是特尔斐法的一个重要特点。,专家的选择,在选择专家过程中不仅要注意选择精通专业技术、有一定声望、有学科代表性的专家,同时还需要选择边缘学科、交叉学科的专家。是否选择承担技术领导职务的专家,要看他们是否有足够的时间来认真填写调查表
10、。,视预测问题规模,专家组一般以10一50人为宜,人数太少,限制学科代表性,并缺乏权威,同时影响预测精度;人数太多,难于组织,对结果处理也比较复杂。专家选定后还可根据具体预测问题,划分从事基础研究预测和应用研究预测的小组,亦可按其他形式分组,实 例,美国“兰德”公司采用特尔斐法科学的突破、人口的增长、自动化技术、航天技术、战争的可能和防止、新的武器系统等6个问题进行了预测。专家组由82人组成,分6个小组活动。成员一半来自于本公司,外单位成员中包括6名欧洲专家。,2、预测问题,(1)制定目标手段调查表 预测领导小组与专家一起对已掌握的数据进行分析,确定预测对象的总目标和子目标,以及达到目标的手段
11、。,实 例,例如,在预测计算技术发展趋势时,总目标是:“当人类在所有活动领域内都采用计算机有效地解决问题时,计算机的技术发展趋向是什么?”其子目标可以划分为:A解决人机联系问题;B提高计算机智能;C. 提高单台计算机效率;D提高全国总装机效率等。达到目标的手段为:a. 改善单元技术;b改善外围设备和通讯技术;c发展信息处理方法(数学模型);d. 改善编程手段;e. 改善计算机结构;f改善使用计算机的组织工作;g. 改善计算机的设计方法等。,(2)制定专家应答问题调查表 这是delphi预测的重要工具,是信息的主要来源。它的质量可能直接影响预测结果。,3、预测过程,经典的特尔斐预测要经过四轮调查
12、。一般说来,经过四轮调查,专家意见可以相当协调或一致。有些派生或改造的Delphi预测方法,考虑到整个过程进行的时间和复杂程度,以及专家意见的一致程度,可以部分取消轮间反馈,适当简化预测过程。,4、应遵守的原则,对DelPhi方法作出充分说明:在发出调查表的同时,应向专家说明DelPhi预测的目的和任务,专家回答的作用,以及Delphi方法的原理和依据。 问题要集中:提出的问题有针对性。 避免组合事件:应避免提出“一种技术的实现是建立在某种方法基础上这类组合事件。, 用词要确切:例如,“私人家庭到哪一年将普遍使用大屏幕彩电”的预测事件中,“普遍”二字比较含糊,另外,“大”字也含糊。如果改为“私
13、人家庭到哪一年将有80使用64cm以上彩电”则是确切的。领导小组意见不应强加在调查表中 调查表要简化,问题数量适当限制。一般认为上限以25个为宜,超过50个问题则要相当慎重。支付适当报酬,以鼓励专家的积极性。,5、结果的处理和表达方式,例如,对事件完成时间预测结果的处理方法如下:在对这类预测进行统计处理时,用中位数代表专家们预测的协调结果,用上下四分点代表专家们意见的分散程度。如果将专家们预测的结果在水平轴上按顺序排列,并分成P等分,则中分点值称为中位数,表示专家中有一半人估计的时间早于它,而另一半人估计的时间晚于它。先于中分点的四分点为下四分点,后于中分点的四分点为上四分点。,第三节 时间序
14、列分析,一、时间序列分析的概念 1. 什么是时间序列 系统中某一变量或指标的数值或统计观测值,按时间顺序排列成一个数值序列(x1,x2,xn),就称为时间序列。,例如:商场的月销售额、城市的季度用电量、地区的每年5月份的降雨量、地区的工业总产值、投资总额,以至由仪器测到的人体心电图,随时间变化的电路电压、电流信号值等都是时间序列的典型例子,系统变量变化的动态过程分为两类:一类是可以用时间t的确定函数加以描述,称为确定性过程,另一类是没有确定的变化形式,也不能用t的确定函数加以描述,但是可以用概率统计方法寻求合适的随机模型来近似地反映其变化规律,这种过程称为随机过程。时间序列预测的主要内容:通过
15、对样本的分析研究,找出动态过程的特性、最佳的数学模型、估计模型参数,并检验利用数学模型进行统计预测的精度,2. 时间序列的特征,通过对各种不同的社会、经济和工程系统中的时间序列的分析发现:时间序列的影响因素的作用特征可以概括为四种变动方式 趋势变动 T 季节变动 S 循环变动(周期变动) C 不规则变动 I,任何一个时间序列总是表现为上述几种变动的不同组合的总结果Y,且可用乘法模型或加法模型表示为: Y=TSCI Y=TSCI,特 征,(1)趋势性,某个变量由于受到某些因素持续同性质(或同向)的影响,其时间序列表现出持续上升或下降的总变化趋势,其间的变动幅度可能有时不等。(2)季节性。时间序列
16、以一年为周期,随着四个季节的推移呈现某种规律性质变化,但是各年变动幅度在各个季节不一定相同,而各季节出现高峰值和低谷值的规律是相同的。,(3)周期性。季节性变动是一种典型的周期变动,它以一年为周期,而且这种周期性主要是由于外部(季节)因素造成的。然而,其它一些系统对象和事物由于其内部因素的相互影响,其动态时间序列会呈现出各种周期长度不同的周期性变动。 (4)不规则性。不规则性变动可分为突然性和随机性变动。,3. 时间序列特征的识别,识别时间序列特征的简单方法是作图法,即以时间为横坐标,以变量值为纵坐标,将时间序列数值绘在坐标因上,一般就可以大致观察到时间序列变动特征。,常见的时间序列图,值,特
17、征的识别,(1)时间序列的随机性识别(2)时间序列的平稳性识别(3)时间序列趋势性识别(4)时间序列周期性(季节性)的识别,通常包括移动平均法和指数平滑法两种,二、 平滑预测法,1. 移动平均法,实 例,下表所示的是某产品上一年度的月需求情况,采用移动平均法,分别按N=3,N=6和N=9逐期做出预测,计算过程与结果,2. 指数平滑法,指数平滑法也是对时间序列进行修均不过它不是求算术平均,而是注重时间序列的长期数值对未来预测值的共同影响,即对时间序列的各个数据进行加权平均,时间越近的数据,其权值越大。,在综合考虑有关前期预测销售量和实际销售量信息的基础上,利用事先确定的平滑指数预测未来销售量。预
18、测公式:预期销售量=(平滑指数*上期实际销售量)+(1-平滑指数)*上期预测销售量,*,基本原理,此法是特殊的加权平 均法,0a 1一般取值0.30.7之间,各系数之和为:a a(1-a) a(1-a)t-1 a(1-a)t = a1- (1-a)t /1- (1-a) =1 上式说明,越是较近期的实际值,系数越大,越是较远期的实际值,系数越小。预测期和第一个月相距越远,则a的系数越小,因而它对预测值的影响也越小。,平滑指数法是特殊的加权平均法,2. 指数平滑法,2. 指数平滑法,2. 指数平滑法,同理可得二次和三次指数平滑值,2. 指数平滑法,预测模型,2. 指数平滑法,的选择,在指数平滑中
19、,平滑常数对预测精度影响很大,因此它的选择十分重要。 值代表了模型对过程变化的反映速度。越大(向l 接近),表示模型越重视近期数据的作用,对过程的变化反映超快;另一方面值又代表预测系统对随机误差的修匀能力, 越小(向0 接近),表示模型越重视离现时更远的历史数据的作用,系统滤波(修匀)能力越强,使对过程变化的反映越迟钝。为了兼顾预测系统既有一定的跟踪过程变化的能力,又有一定的滤波能力,因此的取值应在二者之间折衷。,的选择原则,(1)如对初始值的正确性有疑问时的值宜取大一些,以便扩大近期数据的作用,迅速减小初始值的影响;(2)如果外部环境变化较快,数据随时产生大的变化, 的值宜取大一些,以便跟踪
20、过程的变化(一般取0.30.5); (3)如原始资料比较缺乏,或历史资料的参考价值小(如历史统计数据准确性差), 的值宜取大一点,(4)如果时间序列虽然具有不规则变动,但长期趋势比较稳定(如接近某一稳定常数), 的值应取得较小(0.050.2);(5)对变化甚小的时间序列值宜取小(一般0.10.4),使较早观察值亦能充分反映在平滑值中。,第四节 回归分析预测法,一、一元线性回归模型 二、多元线性回归模型,从被预测变量和它有关的解释变量之间的因果关系出发,预测经济过程未来发展的一种定量方法。函数关系相关关系回归分析方法一元线性回归分析多元线性回归分析非线性回归分析,1、 回归的基本概念,(1)相
21、关函数关系:两个变量之间存在完全确定性关系。 如 价格 销售量 = 销售收入相关关系:两个变量之间存在非确定性依存关系。 如 需求量 与价格 之间的关系 Y = b0 + b1X + u 因变量 自变量 被解释变量 解释变量,一、一元线性回归,(2)回归,1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图(略图),父亲身高,儿子身高,调查结果,“回归”一词的由来,从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的
22、儿子的倾向。得到的具体规律如下:,如此以来,高的越来越高,矮的越来越矮。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”见1889年F.Gallton的论文普用回归定律。后人将此种方法普遍用于寻找变量之间的规律,(3)随机扰动项 u 产生的原因,Y = bo + b1 X + u1. 客观现象的随机性质2. 模型中省略的变量3. 测量与归并误差4. 数学模型形式设定造成的误差,(4)总体回归方程和样本回归方程,样本回归方程Yi= b0 + b1 Xi,总体回归方程Yi= b0 + b1 Xi,2、 参数的最小二乘估计,(1)
23、线形回归模型的基本假定,1.零均值假定:随机扰动项可正可负,可相互抵消 E(ui)=02.同方差假定:各次观察值中ui具有相同的方差 Var(ui)=2 高斯马尔柯夫假定3.无序列相关假定:随机扰动项相互独立 Cov(ui,uj)=0 高斯马尔柯夫假定4.解释变量与随机扰动项不相关假定: Cov(ui,Xi)=05.解释变量之间不存在线性相关假定6.随机扰动项服从正态分布,(2)普通最小二乘法(OLS),普通最小二乘法是一种参数估计方法,确定估计参数的准则是使全部观察值的残差平方和最小,即 ei2 min, 由此得出选择回归参数 b0 , b1 的最小二乘估计式。,残差平方和,使偏导数为零,计
24、算公式,解得,记 X,Y的平均数,则得,(3)例题示范,计算结果的解释,回归参数的数学意义:回归参数的经济学意义:,定义:是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。公式:,3、 相关系数,协方差的意义,、显示x与y是正相关还是负相关协方差为负,是负相关,协方差为正,是正相关。、协方差显示x与y相关程度的大小当相关点在四个象限呈散乱的分布,相关程度很低当相关点分布在x与y的平均值线上时,表示不相关当相关点靠近一直线,表示相关关系密切当相关点全部落在一直线,表示完全相关,相关系数r的性质,、当 时,x与y为完全线性相关,它们之间存在确定的函数
25、关系。、当 时,表示x与y存在着一定的线性相关,r的绝对值越大,越接近于1,表示x与y直线相关程度越高,反之越低。,相关系数的r的推导公式:,相关系数的r的推导公式,多元线性回归的基本思想是什么?多元线性回归的模型与一元线性回归有什么异同?与一元线性回归相比,多元线性回归 的检验有何特殊之处?,二、多元线性回归,多元线性回归分析:研究因变量(被解释变量)与两个或两个以上自变量(解释变量)之间的回归问题,称为多元回归分析。,多元线性回归分析的定义,线性回归自变量个数大于等于2,多元线性回归,1、基本理论,若因变量与解释变量,具有线性关系,它们之间的线性回归模型可表示为(其中b0,b1,bk为回归
26、系数,u为随机扰动项 ):,多元线性回归的基本理论,1、基本理论,将n个观察数据代入上述模型,则问题转化为:,多元线性回归的基本理论,1、基本理论,多元线性回归的基本理论,写为矩阵形式:,1、基本理论,多元线性回归的基本理论,即:,其中,Y, u是n维向量,b是k维向量,x是mk矩阵,1、基本理论,多元线性回归的基本理论,基本假定:,1、基本理论,采用最小二乘估计回归系数b,令:,取最小值,2、参数估计,Q在最小值处偏导数为0,得:,采用最小二乘估计回归系数b,2、参数估计,采用最小二乘估计回归系数b,整理得:,求解该联立方程组即可得,2、参数估计,假设,求得的回归方程为:,3、显著性检验,总
27、离差平方和分解,同一元回归,可得:,并且:,总离差平方和分解,3、显著性检验,总离差平方和:,即是:,回归平方和:,残差平方和:,总离差平方和分解,3、显著性检验,检验的目的:检验Y与解释变量x1,x2,xk之间的线性关系是否显著。,检验的目的,3、显著性检验,检验的步骤,第一步,提出假设:,原假设:H0:b1=b2=bk=0,备择假设:H1:bi不全为0 (i=1,k),3、显著性检验,检验的步骤,第二步,计算统计量:,或:,3、显著性检验,第三步,查表,得:,检验的步骤,3、显著性检验,检验的步骤,第四步,做检验:,拒绝H0,回归方程显著,接受H0,回归方程不显著,检验法则,3、显著性检验,回归方程显著,并不意味着每个解释变量对因变量Y的影响都重要,因此需要进行检验:,回归系数检验的必要性,回归方程显著,每个回归系数都显著,3、显著性检验,回归系数检验的步骤,第一步,提出假设:,原假设:H0: bi=0 (i=1,2,k),备择假设:H1:bi0 (i=1,2,k),3、显著性检验,回归系数检验的步骤,第二步,构造并计算统计量 :,3、显著性检验,回归系数检验的步骤,第三步,查表得 :,3、显著性检验,回归系数检验的步骤,第四步,做检验:,接受H0,检验法则,拒绝H0,3、显著性检验,关于模型的异方差、自相关、多重共线性问题的检验,请参考有关教材。,3、显著性检验,