收藏 分享(赏)

统计学第六章相关回归PPT课件.ppt

上传人:微传9988 文档编号:3480604 上传时间:2018-11-03 格式:PPT 页数:21 大小:237.50KB
下载 相关 举报
统计学第六章相关回归PPT课件.ppt_第1页
第1页 / 共21页
统计学第六章相关回归PPT课件.ppt_第2页
第2页 / 共21页
统计学第六章相关回归PPT课件.ppt_第3页
第3页 / 共21页
统计学第六章相关回归PPT课件.ppt_第4页
第4页 / 共21页
统计学第六章相关回归PPT课件.ppt_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、2018/11/3,统计学讲义 游士兵,1,统计学 Statistics,武 汉 大 学 商 学 院 副教授 游 士 兵 经济学博士电 话:027-6205428713307175789E-mail: ,2018/11/3,统计学讲义 游士兵,2,第六章 相关与回归分析 correlation regression analysis,章前导语:1、有其父,必有其子。-古人和现代人都这么说2、“真的”,公爵夫人说:“火烈鸟和芥末都很刺鼻。那意思是说物以类聚。”“但芥末并不是鸟”,Alice说。“是的,象往常那样,”公爵夫人说“你具有多么清晰的表达方式!”- Alice漫游奇境记,2018/11/

2、3,统计学讲义 游士兵,3,一、基本问题1、相关分析(correlation analysis)(1)什么是相关关系?相关关系是指现象之间客观存在的非确定性的数量对应关系。,2018/11/3,统计学讲义 游士兵,4,(2)相关关系的种类,按相关关系涉及变量的多少,分:单相关(又称一元相关)复相关(又称多元相关) 按相关的表现形式,分:线性相关曲线相关,2018/11/3,统计学讲义 游士兵,5,按相关的方向,分:正相关负相关 按相关的程度,分:零相关低度相关中度相关显著相关高度相关完全相关,2018/11/3,统计学讲义 游士兵,6,2、回归分析 (regression analysis),

3、(1)“回归”的词源(2)相关分析与回归分析的区别和联系区别:A、相关关系所研究的变量是对等关系,而回归分析所研究的变量不是对等关系,分为自变量和因变量;B、相关分析对资料的要求是两个变量都必须是随机变量,而回归分析中自变量是可以控制的变量(给定的变量),因变量是随机变量。C、相关分析的目的是研究变量之间的相关方向、程度以及相关的表现形式是什么;而回归分析的目的是拟合变量之间的表现形式,(回归方程),并据此进行回归预测。,2018/11/3,统计学讲义 游士兵,7,联系:,A、相关分析是回归分析的基础和前提;(通过相关分析的结论,才能引入回归分析)B、回归分析是相关分析的深入和继续。(通过回归

4、分析的继续,最终达到对相关变量之间有关预测,并为管理决策服务),2018/11/3,统计学讲义 游士兵,8,3、本章主要内容,(1)相关系数(the correlation coefficient)(2)回归模型(the regression model)一元线性回归模型多元线性回归模型可化为线性回归的曲线回归模型介绍(3)估计标准误差(standard error of estimate),2018/11/3,统计学讲义 游士兵,9,二、相关系数 the correlation coefficient,1、相关系数的概念和种类概念:相关系数是反映客观现象之间相关关系的方向和程度的统计分析指标

5、。种类:简单相关系数偏相关系数复相关系数本章着重介绍简单相关系数,如果不作说明,相关系数往往指简单相关系数。,2018/11/3,统计学讲义 游士兵,10,2、相关系数的主要内容,(1)相关系数公式来源介绍(2)相关系数的简捷计算公式:,2018/11/3,统计学讲义 游士兵,11,(3)相关系数的应用说明,相关系数是一个相对数,是一个抽象化的统计指标; 相关系数为正,表示X与Y为正线性相关;相关系数为负,表示X与Y为负相关; 相关系数的取值范围为:-1到1之间。 相关系数的绝对值的大小反映线性相关程度的高低,越接近1,表示线性相关程度越高,越接近0,表示线性相关程度越低。一般来说:r的绝对值

6、在0.3以下,为零相关在0.3到0.6, 为低度相关在0.6到0.9, 为显著相关在0.9以上, 为高度相关,2018/11/3,统计学讲义 游士兵,12,(4)相关系数的应用举例,某企业资料如下: 月份 产量 生产费用 X2 Y2 xy(千吨)x (万元)y1 1.2 62 1.44 3844 74.42 2.0 86 4.00 7396 172.03 5.0 115 25.00 13225 575.04 3.1 80 9.61 6400 248.05 3.8 110 14.44 12100 418.06 8.0 160 64.00 25600 1280.07 6.1 132 37.21 1

7、7424 805.28 7.2 135 51.84 18225 972.0合计 36.4 880 207.54 104214 4544.6,2018/11/3,统计学讲义 游士兵,13,三、回归模型the regression model,(一)一元线性回归模型的性质一元线性回归模型是用于分析一个自变量(X)与一个因变量(Y)之间线性关系的数学方程。其一般形式为:Yc=a+bx式中:X是自变量, Yc是因变量Y的估计值,又称理论值。,2018/11/3,统计学讲义 游士兵,14,几点说明:,a和b通常称为回归模型的参数。 a是回归直线的截距,即X=0时Yc的起始值; b是回归直线的斜率,又称回

8、归系数,表示自变量每增加或减少一个单位时, Yc的平均增减量。 回归直线表明的是两个变量之间的平均变动关系。 回归分析的主要目的是建立回归模型,借以给定X值来估计Y值。模型是否合适?估计的误差怎样?怎样进行判断和检验?都从回归模型的特点出发。,2018/11/3,统计学讲义 游士兵,15,(二)一元回归模型的确定,确定一元回归模型的关键是计算参数a和b 而求参数a和b的最佳方法是最小平方法 最小平方法的基本思想(Y-Yc )=0(Y-Yc)2=最小 最小平方法的标准方程式Y=na+b xxy=ax+bx2,2018/11/3,统计学讲义 游士兵,16,应用举例:,某企业资料如下: 月份 产量

9、生产费用 X2 Y2 xy(千吨)x (万元)y1 1.2 62 1.44 3844 74.42 2.0 86 4.00 7396 172.03 5.0 115 25.00 13225 575.04 3.1 80 9.61 6400 248.05 3.8 110 14.44 12100 418.06 8.0 160 64.00 25600 1280.07 6.1 132 37.21 17424 805.28 7.2 135 51.84 18225 972.0合计 36.4 880 207.54 104214 4544.6,2018/11/3,统计学讲义 游士兵,17,解:根据上述标准方程有:8

10、80=8a+b36.44544.6=a36.4+b207.54解方程组,得到:a=51.323 b=12.896则,产量和生产费用的回归直线方程为:Yc =51.323+12.896X,2018/11/3,统计学讲义 游士兵,18,(三)多元线性回归模型,多元线性回归模型是用于分析两个以上自变量与一个因变量之间线性关系的数学方程。其一般形式为:Yc= a+b1x1+b2x2+-+bnxn对于有两个自变量的二元线性回归模型,有:Yc= a+b1x1+b2x2式中: a为截距,b1和b2称为偏回归系数,其均有一定的统计含义,2018/11/3,统计学讲义 游士兵,19,多元回归模型的确定仍然按照最

11、小平方法的原理得到求a和b1、 b2的标准方程组:Y=na+b1X1+b2X2X1Y=aX1+b1X12+b2X1X2X2Y=aX2+b1X1X2+b2X22 计算说明,2018/11/3,统计学讲义 游士兵,20,(四)可化为线性回归的曲线回归模型,在实际问题中,有时因变量和自变量之间的关系并非是线性形式,而是某种曲线,这时,就需要拟合适当类型的曲线模型,统计学上称为曲线回归模型。 统计学上通常采用变量代换法将曲线形式转换成线性形式来处理,使线性回归分析的方法也能适用于非线性回归问题的研究。 现仅举一、二例加以说明,其他则可类似操作。,2018/11/3,统计学讲义 游士兵,21,四、估计标准误差 sxy standard error of estimate,估计标准误差的解释 估计标准误差的统计含义估计标准误差的现实含义 估计标准误差的计算(参照前例计算),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 教育范文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报