收藏 分享(赏)

第七章 相关与回归分析.ppt

上传人:dcjskn 文档编号:5946553 上传时间:2019-03-21 格式:PPT 页数:91 大小:1.07MB
下载 相关 举报
第七章  相关与回归分析.ppt_第1页
第1页 / 共91页
第七章  相关与回归分析.ppt_第2页
第2页 / 共91页
第七章  相关与回归分析.ppt_第3页
第3页 / 共91页
第七章  相关与回归分析.ppt_第4页
第4页 / 共91页
第七章  相关与回归分析.ppt_第5页
第5页 / 共91页
点击查看更多>>
资源描述

1、7-1,第七章 相关与回归分析,第一节 相关分析 第二节 一元线性回归分析 第三节 多元线性回归分析 第四节 非线性模型简介,7-2,目标与要求,1、掌握有关相关与回归分析的基本概念; 2、掌握相关系数的计算与分析应用; 3、理解一元和多元线性回归模型,能够对回归模型进行估计和检验并利用模型进行预测; 4、了解常用的几个非线性模型; 5、能够应用Excel软件进行相关与回归分析。,7-3,第一节 相关分析,一、相关关系的概念与分类 (一)函数关系与相关关系 (二)相关关系的种类 二、相关分析 (一)概念 (二)相关表和相关图 (三)相关系数,7-4,(一)函数关系与相关关系,1、函数关系 当一

2、个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为函数关系。 变量之间保持着严格的依存关系,呈现出一一对应的特征。并可用一个数学表达式反映出来。 例如,某种商品的销售收入()与该商品的销售量()以及该商品价格()之间的关系可用表示,这就是一种函数关系。 再如,圆的面积与半径之间的关系,可表示为S=R2,当半径值取定后,其圆的面积也随之确定。 一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。,7-5,函数关系与相关关系,2、相关关系 指现象之间确实存在的,但关系值不固定的相互依存关系 当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不

3、确定,但它仍按某种规律在一定的范围内变化 例如,劳动生产率与工资水平的关系、投资额和国民收入的关系、商品流转规模与流通费用的关系等等。 理解相关关系要把握两个要点: (1)相关关系是指现象之间确实存在数量上的相互依存关系 (2)现象之间数量依存关系的具体关系值不是固定的,7-6,函数关系与相关关系,3、二者的关系 变量之间的函数关系和相关关系,在一定条件下是可以互相转化的。 具有函数关系的变量,当存在观测误差时,其函数关系往往以相关的形式表现出来。 具有相关关系的变量,如果能够把影响因变量变动的因素全部纳入方程,这时的相关关系也可能转化为函数关系。 相关关系经常可以用一定的函数形式去近似地描述

4、。 函数关系可以用数学分析的方法去研究,而研究相关关系必须借助于统计学中的相关与回归分析方法。,7-7,(二)相关关系的种类,相关方向,相关形式,相关性质,相关程度,变量多少,相关关系的种类,7-8,相关关系图示,7-9,二、相关分析,相关分析,就是研究变量之间相关变动的方向和相关关系密切程度的一种统计分析方法。,相关关系的判断,定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图, 判定变量之间是否存在相关关系及其相关的形式。计算相关系数, 确定变量之间相关关系的密切程度。,7-10,(二

5、)相关表和相关图,相关表,是反映变量之间相关关系的统计表。在定性判断的基础上,把具有相关关系的两个变量的具体数值按照一定的顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称为相关表。 【例7.1】在研究我国人均消费水平的问题时,把全国人均消费记为y,把人均国内生产总值(人均GDP)记为x。我们把1995到2003年的数据排列在统计表上,如表7.1所示,表7.1 我国人均国内生产总值与人均消费金额数据 单位:元,7-11,(二)相关表和相关图,相关图(散点图),是通过直角坐标系反映两变量之间相关关系的图形。也就是把相关表上一一对应的具体数值在直角坐标系中用坐标点的形式描绘出来,用来反映

6、两变量之间相关关系的图形。 根据表7.1的资料绘制的相关图(散点图)如下:,7-12,(三)相关系数,在统计研究中,现象间的相关关系的密切程度用相关系数或相关指数来确定1、直线相关系数的设计思想及计算,设研究总体有N对 ,我们可以计算出对应的均值 和 ,通过点( , )画两条平行于X轴和Y轴的直线,将散点图分成四个部分,7-13,直线相关系数的计算,总体直线相关系数:,更简洁的形式是:,样本的直线相关系数(记为r)的定义公式如下:,简捷法计算公式:,7-14,直线相关系数计算(实例1),【例7.2】根据例7.1的资料,计算人均消费与人均国内生产总值的直线相关系数。 【解】利用Excel计算出相

7、关系数公式中所需要的有关数据,代入公式计算:,7-15,直线相关系数计算(实例2),【例7.3】根据下表中10个学徒工的技术操作训练的时间和月产量的资料,计算并说明相关系数r。,【解】 :,根据表中数据及计算结果,可得:X=35,Y=697,XY=2554, n=10,代入公式得:,7-16,2、相关系数的取值及其意义,(1)相关系数的取值范围在-1和+1之间 (2)相关系数的符号代表着变量间的相关方向,若r为正,表明两变量为正相关;若r为负,表明两变量为负相关 (3)当r=0时,表示x与y之间不存在线性相关关系 (4)当|r|=1时,表示x与y两变量完全线性相关,即x与y之间存在着函数关系

8、(5)当0|r|1时,表示x与y之间存在着一定程度的线性相关关系 |r|的数值越大,越接近于1,表示x与y的线性相关程度越密切;反之,|r|的数值越小,越接近于0,则表示x与y的线性相关程度越低。 一般而言: |r|0.3,称为微弱相关;(可基本认为没有线性相关关系) 0.3|r|0.5 ,称为低度相关; 0.5|r|0.8,称为显著性相关; 0.8|r|1,称为高度相关。,7-17,相关系数取值及其意义(图示),7-18,3、相关系数应用需注意的问题,(1)相关系数r是一个抽象化的相对指标,其本身不表示任何经济涵义,它完全是进行相关分析的工具 (2)根据相关系数r的计算结果,可对一元线性相关

9、关系的相关方向和相关程度作出判断(判断标准如前) (3)相关系数的数值本身并不能证实所讨论现象之间是否存在因果关系,也不能反映现象之间是否存在非线性相关 判别因果依存关系是在对现象的本质属性的分析过程中完成的,这一分析过程应该在建立模型之前进行,否则就可能得出虚假的、无意义的相关,相关系数只有在这个前提下才能判断其相关程度和方向,7-19,4、相关系数r的显著性检验,相关系数的显著性检验问题可分为两类: 一是,对总体相关系数是否等于进行检验; 二是,对总体相关系数是否等于某一个给定的不为的数值进行检验。 数理统计学证明,t统计量可以用来检验相关系数的显著性。检验步骤为:,(1) 提出假设:,(

10、2) 计算检验的t统计量:,(3) 根据给定的显著性水平和自由度(n-2),查找t分布表中的相应临界值,(4) 作出判断。若 ,就拒绝原假设,认为r在统计上是显著的,即总体相关系数不为零,总体变量间确实存在线性相关关系;反之,则不能拒绝原假设。,7-20,相关系数检验(实例1),【例7.4】根据例7.2结果,检验在=0.05的显著性水平下,人均消费额与人均国内生产总值的直线相关系数是否具有统计意义。 【解】提出假设:,检验统计量的值为:,若取显著性水平 ,,查表得到临界值:,由于 ,所以否定原假设,表明总体相关系数不为零,即人均国内生产总值与人均销售金额之间确实存在正相关关系。,7-21,直线

11、相关系数检验(实例2),【例7.5】假设根据对样本观测数据计算出某公司的股票价格与气温的样本相关系数0.50,试问是否可以根据的显著水平认为该公司的股票与气温之间存在一定程度的线性相关关系?,由于 ,因此,不能拒绝原假设,即在统计上是不显著的。这就是说,尽管根据样本观测值计算的达到0.5,但是由于样本单位过少,这一结论并不可靠,它不足以证明该公司的股票与气温之间存在一定程度的线性相关关系。,查表可知:显著水平为,自由度为的临界值,计算的检验值:,【解】:提出假设:,7-22,第二节 一元线性回归分析,一、回归分析含义 二、一元线性回归模型 三、参数的最小二乘估计 四、对一元回归方程的评价 五、

12、预测及应用,7-23,一、回归分析含义,回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型(称为回归方程式), 来近似地表达变量间的平均变化关系的一种统计分析方法。 回归分析内容: 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,7-24,回归分析与相关分析的联系与区别,联系: 相关分析是回归分析的前提和基础,回归分析是相关分析的深入和继续 回归分析和相关分析被合称为相关关

13、系分析 区别: 第一,相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化。回归分析能确切指出变量间相互关系的具体形式,可根据回归模型从已知量估计和预测未知量 第二,相关分析不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。回归分析则必须事先确定自变量和因变量。其中因变量是随机的,而自变量是给定的非随机变量 第三,相关分析通过相关系数来反映变量间相关程度的高低,相关系数值是惟一确定的;回归分析中,互为因果的变量,则有可能存在若干个回归方程,7-25,回归模型的类型,回归模型,7-26,二、一元线性回归模型,1、概念要点 描述因变量 y

14、如何依赖于自变量 x 和误差项 的方程称为回归模型。 对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系。 当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。,7-27,二、一元线性回归模型,对于只涉及一个自变量的简单线性回归模型可表示为: y = b0 + b1 x + e 模型中,y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 0 和 1 称为模型

15、的参数,7-28,二、一元线性回归模型,2、基本假定,假定:误差项是不可观测的随机误差,服从期望为零、方差为 的正态分布,在这个假定下,进一步 ,它表示随机变量y也服从正态分布,且,当x已知时,可以精确算出E(y),7-29,二、一元线性回归模型,3、回归方程 描述y的平均值或期望值如何依赖于x的方程称为回归方程 简单线性回归方程的形式如下:,方程的图示是一条直线,因此也称为直线回归方程,是回归直线在y轴上的截距,是当x=0时,y的期望值,是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值,7-30,二、一元线性回归模型,4、估计(经验)的回归方程,用样本统计量 代替回归方程

16、中的未知参数 ,就得到了估计的回归方程。,总体回归参数 是未知的,必需利用样本数据去估计,简单线性回归中估计的回归方程为:,其中, 是估计的回归直线在纵轴y上的截距。,是直线的斜率。 在实际应用中表示,当x每变动一个单位时,y平均变化 个单位。,7-31,三、参数 的最小二乘估计,最小二乘法,就是使因变量的观察值与估计值之间的离差平方和达到最小来求得 的方法。,即:,我们记 为实际观察值 与回归值 的偏差,称其为残差。我们确定回归直线就是希望这条直线与所有样本数据点都比较靠近,残差平方和 最小就能够较好地体现这个思想。,用最小二乘法拟合的直线来代表X与Y之间的关系与实际数据的误差比其他任何直线

17、都小,7-32,最小二乘法(图示),7-33,的最小二乘估计,根据微积分中求极值的原理, 应满足下列方程组:,经整理后,得正规方程组:,7-34,的计算公式,求解正规方程组,得:,7-35,建立一元线性回归方程(实例),【例7.6】根据例7.1的资料,建立人均消费与人均国内生产总值的回归方程。,【解】根据表7.2已经计算好的有关数据,计算回归方程的参数。可得:,回归方程为:,7-36,四、对回归方程的评价,7-37,(一)一元线性回归模型拟合优度的评价,所谓拟合优度(Goodness of fit),是指样本观测值聚集在样本回归线周围的紧密程度。判断回归模型拟合程度大小的最常用的指标是可决系数

18、(又称判定系数)、估计标准误差等。 1、可决系数r2 它是建立在对总离差平方和进行分解的基础之上的,7-38,1、可决系数r2,离差平方和分解,将SST分解成如下:,其中, 这样有:,把y的n个观察值之间的差异,用观察值 与其平均值 的偏差平方和来表示,称为总离差平方和SST,7-39,1、可决系数r2,三个平方和的关系: 总偏差 = 回归偏差 + 剩余偏差简记为: SST = SSR + SSE,7-40,1、可决系数r2,x,y,离差分解图,离差平方和的分解(图示),7-41,1、可决系数r2,若将SST=SSR+SSE两边同除以SST得:,回归平方和与总离差平方和之比被定义为可决系数(又

19、称判定系数),即:,表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。,可决系数是对回归模型拟合程度的综合度量,可决系数越大,回归模型拟合程度越高。,7-42,1、可决系数r2,可决系数r2的特性 可决系数r2具有非负性 可决系数的取值范围为0r21 当所有的观测值都位于回归直线上时,残差平方和SSE=0,这时r2 =1,说明总离差可以完全由所估计的样本回归直线来解释; 当观测值并不是全部位于回归直线上时,SSE0,则SSE/SST0,这时r2 1; r2 越接近于1,说明回归方程拟合的越好;越接近于0,说明回归方程拟合的越差 当回归直线没有解释任何离差,Y的总离差全部归于残差平方和,

20、即SSE=SST,这时r2 =0。 可决系数是样本观测值的函数,它也是一个统计量 一元线性回归模型中,可决系数是单相关系数的平方,7-43,2、估计标准误差,估计标准误差 是实际观察值与回归估计值离差平方和的均方根;它反映实际观察值在回归直线周围的分散状况;从另一个角度说明了回归直线的拟合程度。,可以证明:在直线回归分析中,剩余回归平方和的自由度为n-2,于是 是误差总体方差 的无偏估计量,其平方根称为估计标准误差,记为:,7-44,2、估计标准误差,估计标准误差越小,表明回归线有较强的代表性,回归直线对Y的拟合优度就高;反之,回归线的代表性较差,拟合优度低,为了方便计算,由上式可推导出计算公

21、式为:,7-45,(二)一元线性回归方程的显著性检验,1、回归系数的显著性检验-t检验 检验的步骤:,(2)t检验的计算公式为: , 其中 ,是回归系数标准误差,(3)给定显著性水平,确定临界值,(4)若 ,则拒绝 ,即总体回归系数 ;否则不能拒绝,7-46,(二)一元线性回归方程的显著性检验,2、回归系数的显著性检验-p- 检验,检验步骤:前二步与t检验相同,但t值计算出来之后,是直接计算自由度为n-2的t统计量大于或小于根据样本观测值计算的 的概率,即p-值。然后将其与给定的显著性水平 对比,如果p-小于 ,则拒绝原假设,反之则接受原假设。,利用Excel进行回归分析时,计算机将直接给出回

22、归系数估计的p值。,7-47,回归方程评价(实例),【例7.7】根据例7.1的资料,计算可决系数、估计标准误差,并对回归方程进行检验(=0.05)。,【解】:,首先将每个x 代入回归方程,得到一个序列 ,再将有关数据代入相关公式计算。我们可以用Excel辅助计算,见下表:,7-48,计算检验回归方程统计量的辅助表 (表7.4),7-49,回归方程评价(实例)解,可决系数:,估计标准误差:,或:,7-50,回归方程评价(实例)解续,下面进行检验:,t 检验: 由于=0.05,所以,由于 ,因此,拒绝 , 即总体回归系数,7-51,Excel解决方案,1、将数据输入工作表中 2 、选择菜单“工具”

23、“数据分析”,打开“数据分析”对话框 3 、选择其中的“回归”,打开对话框,见下图“回归”分析工具对话框,7-52,Excel解决方案,4 、正确填写相关信息后,点“确定”,结果在H1到N18这个区域内显示,见下图,7-53,五、预测及应用,1、回归分析的点估计,点估计,就是对于自变量x的一个给定值x0 ,根据回归方程得到因变量y的一个估计值,点估计值有y的平均值的点估计和y的个别值的点估计。在点估计条件下,两者是一样的。,前例中,如要估计人均国内生产总值为9500元时,所有年份人均消费金额的平均值,就是平均值的点估计。根据估计的回归方程得:,如只想知道2004年人均国内生产总值为10000元

24、时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得:,7-54,五、预测及应用,2、回归分析的区间估计 区间估计,是指对于给定的自变量x的值,求出y的一个估计区间。 区间估计有两种: y平均值的置信区间估计; y的一个个别值的预测区间。,(1)Y的平均值 的置信区间估计,利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间,E(y0) 在 置信水平下的置信区间为:,7-55,2、回归分析的区间估计,(2)Y的个别值的预测区间估计利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y

25、的一个个别值的估计区间 ,这一估计区间称为预测区间,y0在 置信水平下的预测区间为:,7-56,回归分析的区间估计(图示),7-57,2、回归分析的区间估计,(3)区间估计结论 首先,总体均值的预测区间比个别值的预测区间要窄; 其次,样本容量n越大,则残差的方差越小,预测精度越高;,就是说,用回归模型进行预测时,x0 的取值不宜离开过远,否则预测精度将会大大降低,预测就不准。,最后,在n一定时,当预测点 时,残差的方差最小,预测区间最窄;离 越远,残差的方差越大,预测区间越宽,预测可信度下降。,7-58,回归方程区间估计(实例),【例7.8】根据例7.1的资料,若2004年的人均GDP为100

26、00元,求人均消费95%的置信区间。,【解】:将 代入回归方程得:,查表得 ,其它数据参见表7.4,则:,7-59,回归方程区间估计(实例)解,Y的平均值的95%的置信区间:,即置信区间为:(4444.593 , 4746.567)元,7-60,回归方程区间估计(实例)解,Y的个别值的95%的置信区间:,即置信区间为:(4370.672 , 4820.488)元,7-61,第三节 多元线性回归分析,一、多元线性回归模型 二、多元回归模型的参数估计 三、对多元线性回归方程的评价,7-62,一、多元线性回归模型,多元线性回归分析,研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系

27、。 表现这一数量关系的数学公式,称为多元线性回归模型 多元线性回归模型的一般形式:,y称为因变量,是被解释变量,而 是p个可以精确测量并可控制的一般变量,称为自变量,,是随机误差。说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性,p=1时,上式即为一元线性回归方程, 时,我们就称上式为多元线性回归方程模型。,7-63,回归模型矩阵形式,对于n组实际观测数据, i=1,2,.,n,则线性回归模型可表示为:,写成矩阵形式为:,其中:,7-64,多元线性回归模型的基本假定,1、解释变量 是确定性变量,且要求矩阵X中的自变量列之间不相关,样本容量的个数应大于解释变量的个数。,2、随机误差项

28、具有零均值和同方差,即随机误差项 的期望值为0,且方差 都相同。,3、误差项 是一个服从正态分布的随机变量,即,7-65,多元线性回归方程,描述Y的平均值或期望值如何依赖于 的方程称为多元线性回归方程。,多元线性回归方程的形式为:,7-66,二、多元回归模型的参数估计,对于矩阵形式表示的回归模型,如果参数估计量 已经得到,则有,参数的最小二乘估计值为:,式中 ,表示 的转置矩阵,7-67,三、对多元线性回归方程的评价,(一)拟合优度检验 在多元线性回归分析中,总离差平方和的分解公式依然成立: 总偏差(SST)= 回归偏差(SSR)+剩余偏差(SSE) 因此,也可以用上一节所定义的判定系数(可决

29、系数)作为评价模型拟合程度的一项指标,7-68,1、判定系数,为了避免混淆,多元回归的判定系数用 表示。即:,多元线性回归方程中,各回归方程所包含的变量个数未必相同,因此,在多元线性回归分析中,通常采用“修正自由度判定系数”来判定现行多元回归方程的拟合优度:,p是因变量的个数,n为样本容量。(p1)和()实际上分别是总离差平方和与残差平方和的自由度,7-69,修正自由度判定系数的特点,(1),对于给定的 值和n值,p值越大, 越小。在进行回归分析时,一般总是希望以尽可能少的自变量去达到尽可能高的拟合程度。 作为综合评价这方面情况的一个指标显然比 更为合适。,在拟合极差的场合, 有可能取负值。,

30、7-70,估计标准误差,多元回归模型估计标准误差的计算公式:,7-71,(二)多元线性回归模型的显著性检验,1、回归方程的显著性检验 检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验 检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用 F 检验来分析二者之间的差别是否显著 如果是显著的,因变量与自变量之间存在线性关系 如果不显著,因变量与自变量之间不存在线性关系,7-72,回归方程的显著性检验,回归方程的显著性检验步骤:(1)提出假设:,(2)计算检验统计量F,(3)给定显著性水平,查F分布表,得临界值,(4)做出判断:,若 ,则拒

31、绝原假设,认为回归方程是显著的,反之,则接受原假设,认为回归方程不显著,所建立的回归模型没有意义。,7-73,2、回归系数的显著性检验,如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著 对每一个自变量都要单独进行检验 应用 t 检验 在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验,7-74,回归系数的显著性检验,回归系数的显著性检验步骤:(1)提出假设:,(自变量xi与因变量y没有线性关系),(自变量xi与因变量y有线性关系),(2)t检验的计算公式为:,若 ,则拒绝 ,即总体回归系数 ,反之

32、,则接受,(3)给定显著性水平,确定临界值,(4)做出判断,注意: 有多少个回归系数,就要做多少次t检验。,t值应该有p个,7-75,二元线性回归预测(实例1),【例7.9】十个地区某种商品的需求量与其价格以及消费者收入的资料,见表,推算若价格在40百元、消费者收入为1700万元时,该商品的需求量。,7-76,二元线性回归预测(实例1)解,【解】借助Excel回归分析工具,完成计算任务,分析结果见表,7-77,二元线性回归预测(实例1)解,根据分析结果表所提供的数据显示:,1、二元线性回归模型是:,2、判定系数: ;调整后的判定系数:,4、回归系数的显著性检验。,即若=0.05,两个t检验都是

33、拒绝 ,即回归系数 和 是有意义的。,3、回归方程的显著性检验。,F统计量为32.0894,,拒绝,5、商品需求量预测。,当 =40, =1700时,代入方程可得:y=7213.629(吨),7-78,二元线性回归预测(实例2),【例7.10】一家百货公司在10个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程,并分析回归方程的拟合程度,对线性关系和回归系数进行显著性检验(=0.05)。,7-79,二元线性回归预测(实例2)解,【解】借助Excel中的回归分析工具

34、,完成计算任务,见表,7-80,二元线性回归预测(实例2)解,计算机输出结果的解释:,1、销售额与人口数和年人均收入的二元回归方程为:,2、判定系数,调整后的判定系数,3、回归方程的显著性检验:,回归方程显著,4、回归系数的显著性检验:,=0.05时,,两个回归系数均显著,7-81,第四节 非线性模型简介,一、非线性回归分析的意义 二、非线性函数形式的确定 三、几种常见的非线性模型,7-82,一、非线性回归分析的意义,在复杂的现象中,为观察数据,拟合曲线回归方程所建的模型称为非线性模型。所进行的分析,称为非线性回归分析。 非线性回归分析必须着重解决以下两个问题: 第一、如何确定非线性函数的具体

35、形式。 第二、如何估计函数中的参数。,7-83,二、非线性函数形式的确定,1、选择回归方程的具体形式应遵循的原则 首先,方程形式应与有关实质性科学的基本理论相一致 其次,方程有较高的拟合程度 最后,方程的数学形式要尽可能简单 2、非线性回归方程的测定方法 通过变量的变换,将其化成线性回归问题,然后用线性回归分析方法来解决非线性回归问题 非线性回归转化为线性回归,最关键的是选定变量X与变量Y相互之间相近的恰当的曲线类型 通常用散点图,从图像上显示出来的曲线形状判断应拟合的曲线 非线性函数的线性变换方法有直接代换法和间接代换法。,7-84,几种常见的非线性模型, 指数函数,线性化方法 两端取对数得

36、:lny = ln + x 令:y = lny,则有y = ln + x,基本形式:,图像,7-85,几种常见的非线性模型, 幂函数,线性化方法 两端取对数得:lg y = lg + lg x 令:y = lgy,x= lg x,则y = lg + x,基本形式:,图像,7-86,几种常见的非线性模型, 双曲线函数,线性化方法 令:y = 1/y,x= 1/x, 则有y = + x,基本形式:,图像,7-87,几种常见的非线性模型, 对数函数,线性化方法 x= lgx , 则有y = + x,基本形式:,图像,7-88,几种常见的非线性模型, S 型曲线,线性化方法 令:y = 1/y,x= e - x, 则有y = + x,基本形式:,图像,7-89,四、应用回归分析应注意的问题,1、回归分析只有在定性分析的基础上进行,才有实际意义。 2、利用回归模型进行估计和推断时,必须注意其应用范围。 3、要正确把握回归参数的含义。 4、应当对回归参数及自变量进行显著性检验。对回归参数进行检验是为了判断回归方程的有效性。在多元回归分析中对自变量进行检验则是为了判定自变量对因变量是否有显著影响,从而决定自变量的取舍。,7-90,思考练习题,思考题: P289-290 :1、2、8 练习题: P290:1、3、4,7-91,结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 教育学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报