1、编号(学号):12914008优化理论课程论文( 08 级 1 班 )题 目: 最小二乘法在经济预测中的应用 学 院: 理学院 专 业: 信息与计算科学 姓 名: 刘天政 指导教师: 张永祥 完成日期: 2011 年 12 月 18 日最小二乘法在经济预测中的应用摘 要:由于经济发展呈现一种鹏飞的状态及其可能的动荡会引起严重的后果,使得经济预测成为了一个必然产物,预测会使人们在将来经济上可能出现的波动有所准备降低损失或增加收益.本文选择了经济预测中的其中一种方法最小二乘法的基本原理,并且利用了线性回归预测模型.同时对相关系数和标准偏差进行检验.最后给出了利用最小二乘法进行经济预测的实例.实现对
2、产品生产的预测让各方面对产品的产量有个简单的了解.关键词:最小二乘法;线性回归;产品生产预测一.引言随着改革开放的步伐带动各地的经济发展状态呈现一片大好的形势,由于地域人文不同各地经济特色也各显风骚.本文以某县为例,该县是全国经济百强县之一,全县大都以染料、纺织和布匹等生产加工为主.笔者了解到支撑该县经济支柱的大部分是以生产加工上述产品的中小企业甚至家庭型企业.由于他们规模不是很大,因此相应的各技术部门没有很好的配备,所以进行生产管理的方式没有像大型企业那样规范,他们产品的年产量往往根据企业主近几年摸爬滚打中积累起来对市场的判断来制订的,而没有进行科学的经济预测,这常常导致大量产品销售不够或大
3、量产品积压在家,给企业带来严重影响.经济预测是进行经济决策活动的一个重要组成部分.在实际经济活动中,预测的结果可以揭示经济现象在未来时期发展变化的情况和发现经济发展过程中存在的问题,从而为进行决策、制订计划、提高经济管理水平以及获取较好的经济效益提供了科学依据.运用定量预测模型进行预测的方法有很多,依据笔者对许多家庭型企业的了解及对企业主知识层次的分析,本文介绍的最小二乘法在经济预测中的应用方法简单明了,比较适合这些企业在进行预测产品产量时参考,从而能够避免盲目的生产和经营,尽可能地为企业获得最大利润.二.最小二乘法最小二乘法是由实验或调查的数据,建立线性型公式的一种常用方法.在建立线性型公式
4、中,虽然有很多种不同的方法来求样本回归函数(即,真实总体回归函数的估计值),但是,在回归分析中最广泛应用的方法是最小二乘法.如果变量 有精确的线性关系比如说 ,那么 即观测值与回归值yx和 baxyiiy是相等的.事实上现实世界中的诸多变量的关系未必都是如此,由于受诸多随机因数的干扰使得物与物之间没有那种很明确的对应关系.比如说人的身高和体重就是一个对应,我们都知道长的高的人不一定就重,同理长的矮的人也不一定就轻,但身高和体重的确存在着一定的关系,而这种关系并非是 所能确定的.那么我们要寻求身高和体重之间的关系baxy就需要通过数学的方法.首先调查统计得出数据;其次把数据描绘出来;然后拟合一条
5、跟已有的图象最接近的曲线,这样就可以相对地将身高和体重之间的关系表示出来. 在处理类似的事情中常常用到最小二乘法.所谓最小二乘法就是:选择参数 ,使得全部观测的残差平方和最小. 用数学10b公式表示为: 21022 )()(min iiiii xbYYe为了说明这个方法,先解释一下最小二乘原理. (一元线性回归方程)iiixBY10由于总体回归方程不能进行参数估计,我们只能对样本回归函数来估计即: (1.1) ii eb10 ).2,1(ni从(1.1)公式可以看出:残差 是 的真实值与估计值之差,估计总体回归函数最优方法iiY是,选择 的估计量 ,使得残差 尽可能的小.10,B10i总之,最
6、小二乘原理就是选择样本回归函数使得所有 Y 的估计值与真实值差的平方和为最小,这种确定 的方法叫做最小二乘法. 10,b在经济关系中,往往某一指标与多个因素有关,如果这种关系具备一定的线性相关性,就可以用多元回归分析来处理,假设由观测得到一组数据: ),.(),.,.(),.( 2122112 nmnmmxxx, , yyy令向量分别为:),.(),.(212121,nmmnyYxX 如果向量组 与 Y 存在线性关系,得到 n 元线性预测公式m,.21(1.2)mXaXaY.210其矩阵形式为: (1.3)ny21 mnnmaxx 1021212其中 为待定常数,亦称回归系数.ma.,10如何
7、来确定 的值呢?将每组观测值代入(1.3)就得到:imiii xaxY.210 ).2,1(ni特别地 时 (1.4)nY10与 间存在差异.记iiyieiiy我们选择这样的 使每个偏差 都尽量小,因为偏差(ma,.10ie).2,(n)有正有负,所以偏差的代数和 并不能反映总体偏差的大小,而 iiY)iiYy数学上处理起来也比较繁杂,所以通常采用使偏差平方和 为 最小.iiy 2ie即 最小 (1.5)niS12210 ).( imiii xaxay显然,偏差平方和随 的变化而取不同的值,可把 视为 的多元函数,并ma.,10 Sma.,10求极值得: niaS10)1(.(2210 imi
8、ii xaxyi 0.1iiiiianimaS1)(.(2210 imiiii xaxy整理得:(1.6) nini ni niniimmimimnini niniiiinii i iiyxaxaxxa xyax111112220111122101. 将上述 m+1 个方程式联立起来就 求解,则得到公式(1.5)的待定系数值,从而m.,10确定了多元线性预测公式.特别地当 时, 的估计公式为:1n10,a(1.7)niniiiininixyyaxa11221110)(三.相关系数与标准偏差3.1 相关系数 R以两个变量的情况为例,因为只要任意给定两个变量 的一组数据,都可以经过计yx算给出一个
9、经验公式,这个公式在多大程度上反映了 的关系呢?因为只要通过最小二乘,法采取强拟合我们同样可以把一组毫无线性关系的数据表成线性关系,但这条直线并不能很好地反映了变量 的实际关系,缺乏应用价值,例如:yx和01234567891011121314151 3 5 7 9 11 13 15原 始 散 点 图强 拟 合 后 散点 图为此我们一方面要建立从经验上认为有意义的方程,另一方面我们必须用数学方法进行拟合效果和显著性相关检验. 其公式如下:我们称 R= 为 的相关系数,其中:yxL和 )(1yxyxniixy 222 )()(1xxnLix yyiyixn1in1由上可推算: yLRS)(2由
10、, 有 ,所以 , 越接近 1, 越接近 0, 的线性关0SyL012R1Syx系越好.(1) 当 时, 即 =0,称 完全线性关系.,Sieyx,(2) 当 时。说明 无关,即不存在线性关系.0xyL(3) 当 时,可选定相关系数的显著性水平 ,按 的值查相关1R2n系数显著性检验表求出临界值 .(4) 当 时,说明 的值的变化对 的值的变化影响很大, 存在强相关ixiyyx,关系.(5) 当 时,所求相关关系是无效的,即经验公式是无意义的.R3.2 标准偏差2)(1iixyYnS其中: -标准偏差 -实例值iy-预测值 -数据点个数iYn四.预测实例经验公式 是平面上统计点的分布呈线性时的
11、表示形式,同时它也是小xa10二乘理论的“形之根本“,即无论是线性的还是非线性的最后都是要化为这种形式.下面我们就散点图呈曲线的情况进行预测.例:对 纺织品销售额的拟合.我们选取销售额为因变量,单位为万元,拟合销售额关于时间 的趋势曲线.以 1991 年为基准年,取值 =1,2001 年 =11,19912001 年的数据x xx如表一.表一 年份 x1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001y19.8 25.6 40.0 49.0 68.0 92.0 112.0 138.0 182.0 238.0 432.0作出表一所给数据的
12、分布图:销 售 额 趋 势 图0501001502002503003504004501991 1993 1995 1997 1999 2001年 份销售额年 份由散布图可以看出统计点是非线性的,它大致呈指数形分布. 我们就取经验公式(1.8)xey来拟合这条曲线.这个经验公式所反映的点的排列是非线性的,我们可以通过取对数将其转化为线性函数从而运用最小二乘法确定这个线性函数. 即: 其中BAxz, ,进而计算 的值.ln,lnyxyl,取 ; 为各年的销售额; ,根据具体数据代入得到如下的表格 . )1.2,(ixi iiz表二 年份 ixiy2ixiiyzlnizx1991 1 19.8 1
13、2.986 2.9861992 2 25.6 4 3.243 6.4861993 3 40.0 9 3.689 11.0671994 4 49.0 16 3.892 15.5681995 5 68.0 25 4.220 21.101996 6 92.0 36 4.522 27.1321997 7 112.0 49 4.718 33.0261998 8 138.0 64 4.927 39.4161999 9 182.0 81 5.204 46.8362000 10 238.0 100 5.472 54.722001 11 432.0 121 6.608 66.748合计 66 1396.4 50
14、6 48.941 325.085得出 : 02iiiii zxBxAn即 : 941.865350ln7342.12056.38BA查对数表得 ,将 代入(1.8)式中,因此得到了所求的经验公式为:394.15(1.9)xey28509.下面计算相应系数进行显著性检查:9240.15)(439.1122znzLxznzzxz,那么751.083.49.zxR7.R查看关系表(按 得到回归临界值 ,因为)92,n735.0 ,说明 间存在强相关关系,可以按公式:751.0.yxey28509.34进行外推预测,预测该企业 2002 和 2003 年的销售额为:( 万 元 )万 元 )90.62(
15、713y以上是根据散点分布趋势选取曲线来拟合得出的结果,那么如果我们强行用线性关系即 BAxY来拟合曲线,会得出怎样的结果呢?同样根据数据表年份 时间序号 ix销售额(万元) iyix2iiy1991 1 19.8 19.8 1 392.041992 2 25.6 51.2 4 655.361993 3 40.0 120 9 16001994 4 49.0 196 16 24011995 5 68.0 340 25 46241996 6 92.0 552 36 84641997 7 112.0 784 49 125441998 8 138.0 1104 64 190441999 9 182.0
16、 1638 81 331242000 10 238.0 2380 100 566442001 11 432.0 4752 121 186644合计 66 1396.4 11937 506 326116.4得出: 193764.650BA得出: 5.,.32因而: (2.0).50xY相关系数 879.0146. zxLR查看关系表(按 得到回归临界值 .)2,01n7350,说明我们可以按公式 来进行趋势预测,得出: 735.019.6350.xY万 元 )万 元 )(419.213Y我们把两组数据比较一下:( 万 元 )万 元 )904.62(3713y万 元 )万 元 )(4019.352
17、1Y显然第二种方法的结果误差太大,这是由于没有考虑散点图分布发展的趋势,强行采用线性拟合的结果.由此可见.某产品在一个时期内产量比较稳定,就可用最小二乘法进行趋势预测,但选用曲线来拟合散点时必须依据散点的趋势正确选择曲线,否则有可能出现类似本文的情况即,两条曲线的显著性系数都符合要求都可以用来预测,但其中的一条由于没有分析散点的发展趋势以致于产生的误差太大.所以企业在日常生产管理中预测方法的科学性,将很大程度上决定企业的利润,从而给经营者制定或调整计划提供了理论依据.参考文献1.韩於羹.应用数理统计M .北京:北京航空航天出版社 :157-191.2.徐天群,董亚娟等.应用数理统计学习指导M .武汉:武汉大学出版社 :156-170.3.方开泰,全辉等.实用回归分析M .科学出版社:20-94,141-160.4.岳苓水,赵宝贵.最小二乘法在商品销售预测中的应用 J.地质技术经济管理,1997.1:57-60.5.杜国毅.最小二乘法在经济预测中的应用J .内蒙古统计 ,2001,(06) . 53-54.6.陆健.最小二乘法及其应用J .中国西部科技,2007,(19). 7.刘瑞芳,梅孝安.最小二乘法数据处理J .电脑知识与技术 (学术交流),2007,(05).