1、,第一讲基于数学建模基础上的经济变量线性回归统计预测分析,一、定义:研究变量间的变动关系,并用数学方程式表示。称回归分析。 (特别应用于:定量地描述和解释相互关系,估计或预测因变量的值。 回归分析是最灵活和最和统计方法之一。它用于分析一个因变量与一个或多个自变量间的关系。) 二、例子:当我们研究产品销量与价格及其它影响销量的变量因素,例如,广告、促销等之间相互关系。利用回归分析可以解释如下问题:价格如何影响销量?若价格和广告支出同时变化一定量的值,则销售预期为多少?我们用市场广告费,销售额对利润额的影响来说明回归基本思想。资料如下表:,表一:某产品广告费和销售额资料,本例中原始数据包含一个变量
2、值,其中销售额为因变量,广告费为自变量。 在回归分析中通常采用与方法相适应固定步骤: (1)用线性回归关系式确定以事实为基础的因果模型。 (2)根据观测数据,估计该回归函数有关参数。 (3)必须检验该估计数学的准确性。,1、观察散点图在上例中,销售主管基于他在市场评估方面经验,推出利润额受广告费的影响。散点图如下:,根据散点图可以判断能存在线性关系,2、建立数学模型,估计回归函数(1)简单回归从上图可以看出销售额与广告费是线性关系,我们估计因变量y(销售额)的值要求做如下函数: 回归函数,式中,为y的估计推算值,a为回归直线起点值,b,为回归系数,即回归直线斜率。 在相关图上,a是回归直线与y
3、轴交点,数学称纵轴的截距,b是回归系数,它表示自变量增(减)一个单位。因变量平均增加(减少)值。,a、b是回归直线两个参数,要确定回归直线,先求解a、b。 我们可以利用最小二乘法确定参数a、b的值。最小二乘法是最重要的统计估计方法之一。观察值与估计值的偏差平方后,较大偏差权重加大,从而避免了正负偏差相互抵消。,使,最小,把,代入上式,得,使,最小,求偏导数得:,整理得:,a,b确定后,回归直线方程就确定下来了。给定x的值。就可估计推算的值。根据上述资料就可得到。,得,解得:a=14.25505057,b=3.98342623,回归方程为:,b表示回归系数,广告费每增加10000元,产品销售额平
4、均3.98342623万元。 给定x=1.0,代入回归直线方程,估计推算出:18.23847680,(2)多元线性回归分析在现实中,往往一个因变量,受多个自变量的影响。如果只用一个自变量来进行回归分析,分析结果存在问题,如果将影响因变量的多个因素结合在一起进行分析,则更能体现现象内在的规律,统计中,将涉及两个及以上的自变量的线性回归分析称多元线性回归分析。多元线性回归分析研究因变量和多个自变量的线性关系,这种线性关系也可用数学模型来表示,记因变量为y,因变量y与自变量x1,x20,xn之间存在线性关系,可用多元线性回归方程来表示这种关系,设多元线性回归方程为:,式中,为线性回归方程参数,要解多
5、元线性,回归方程,须首先确定这些参数。参数的求解通过多元线性方程来求解。由于二元线性回归方程是最典型的多,元线性回归方程,通过观察求解二元线性回归方程参数过程,就可了解其它类型的多元线性回归方程参数。了解其它多元线性回归方程参数求解方法。设有二元线性回归方程:,使,最小,把,代入上式,得,使,最小,求偏导数得:,该方程可以解出,三个参数,此时二元线,性回归方程,可确定,给定,值,可估计推算出,的值,如果一个销售主管,在调查广告费用以及各种促销支出对销售额影响来确定增加促销支出是否值得,我们如果采用上例中直线回归方法不能解决这类问题,我们应用多元线性回归方程。,上述促销支出,广告费和利润额间存在
6、线性关系,其中销售额,广告费是自变量,利润额是因变量,设二元线性回归方程为:,二元回归方程为:,解得:a=-5.6259,b1=0.1275,b2=3.5407,给出,推出y值为12.4334百万元,3、估计标准误差我们利用回归方程的一个重要作用在于根据自变量已知值推算出因变量可能值。这个可能值称估计值,它和真正的实际值可能一致,也可能不一致。因而产生估计值来代替实际值。当两者一致时,表明推理正确,当两者不一致时表明推理不正确,显而易见,将一系列的估计值和真实值加以比较,可以发现其中存在着一系列离差,有的是正的,有的是负的,回归方程代表性如何,一般是通过估计标准误差指标的计算来加以检验,估计标
7、准误差是用来说明回归方程代代表性大小的统计分析指标,其计算原理与标准差基本上相同计算公式如下:,式中n-2为自由度,,是y对x的估计标准误差。,实际应用中,要求有大量变量值资料,为了计算估计标准误差方便,用n代替n-2,估计标准差计算公式改为:,根据上例中数据计算估计标准误差为:,而用n代替n-2,估计标准误差为:,强调的是,不能用回归分析,也不能用其它统计方法肯定地证明因果关系,回归分析只能证明变量的相关关系,这是因果关系的必要而非充分条件,回归分析的统计预测方法是为所有变量收集历史数据,因此是预测中最费时的,回归分析中因果关系通常只是一个假设,即研究者的猜测因而,始终必须检验此类假设的可信性,对此,需要统计学以外知识即理论和逻辑思考,或者进行实验。,