收藏 分享(赏)

第八章 相关与回归_li.ppt

上传人:dwy79026 文档编号:6495791 上传时间:2019-04-14 格式:PPT 页数:42 大小:746.50KB
下载 相关 举报
第八章 相关与回归_li.ppt_第1页
第1页 / 共42页
第八章 相关与回归_li.ppt_第2页
第2页 / 共42页
第八章 相关与回归_li.ppt_第3页
第3页 / 共42页
第八章 相关与回归_li.ppt_第4页
第4页 / 共42页
第八章 相关与回归_li.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、第八章 直线回归与相关分析,前述各章讨论的问题,都只涉及一个变量或性状,而在实际研究中常常要研究两个或两个以上变量的关系。变量间的关系分为两类:完全确定性关系;(没有随机误差)不存在完全确定性关系,不能由一个或几个变量的值精确地求出另一个变量的值;(相关关系),例如,相关变量间的关系一般又分为两种:因果关系(一个变量的变化受一个或几个变量的影响,有自变量/依变量之分);研究方法:采用回归分析研究目的(任务):揭示变量间的联系形式,建立回归方程,并由自变量(原因)来预测、控制依变量(结果),平行关系(它们互为因果或两个以上变量之间共同受到另外因素的影响,无自变量与依变量之分)研究方法:采用相关分

2、析研究目的(任务):研究两个变量之间相关的程度和性质或一个变量与多个变量之间相关的程度(计算相关系数),直线回归分析 一元回归分析曲线回归分析多元线性回归分析 多元回归分析(复回归分析) 多元非线性回归分析,回归分析,简单相关分析直线相关分析复相关分析 多元相关分析偏相关分析,相关分析,第一节 直线回归分析,一、直线回归方程的建立研究两个变量之间的关系时,一般先把n对观察值(x1,y1), (x2,y2), , (xi,yi), (xn,yn)先以x为横坐标,y为纵坐标在直角坐标纸上描出 n 个点, 所描出的图形叫散点图。,x与y的关系散点图,下一张,主 页,退 出,上一张,散点图可直观地、定

3、性地表示了两个变量之间的关系。, 两个变量间有关或无关;若有关,两个变量间关系类型,是直线型还是曲线型;,由散点图可以看出:, 两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);,在直线回归分析中主要是研究图中(b)与(e)的情况。设变量x与y间存在直线关系,根据n对观察值所描出的散点图如下图所示。,直线回归散点图,x,回归直线是所有直线中最接近散点图中全部散点的直线。设样本直线回归方程为:总体直线回归方程为:,其中:a称为回归截距;b称为回归系数,y=+x,回归值 与yi观察值间的偏差为:全部偏差平方和为:利用最小二乘法,即使偏差平方和最小的方法求a与b的值。根据

4、微积分学中求极值的原理,将Q对a与b求偏导数并令其等于0:,可以证明称之为x与y的离均差乘积和,简称为乘积和,记为 SPxy。回归方程的性质回归直线必然通过 点。,线性回归方程建立的方法(结合例8.1): 用各组观察值(xi,yi)描点作散点图,确定变量x和y间是否存在直线关系; 计算回归截距a和回归系数b;,建立样本直线回归方程,并进行显著性检验;在散点图中,画出样本直线回归方程。,直线回归方程的偏离度估计,根据使偏差平方和 最小建立了直线回归方程。偏差平方和Q的大小表示了实测点与回归直线偏差的程度, 因而偏差平方和又称为离回归平方和或剩余平方和, Q的自由度df=n-2 。,离回归标准误,

5、 表示了回归直线与实测点的吻合程度,即回归估测值 与实际观察值y差异的程度。,二、直线回归的显著性检验,能否利用所建立的直线回归方程来进行预测和控制, 这取决于这个直线回归方程所反应的两个变量间的直线关系是否真实。因而还须对y与x间的直线关系进行检验。检验的方法有回归关系的F 检验和回归系数的t 检验二种。,(一)t 检验对直线回归系数b的假设检验为:HO: =0;HA : 0(为总体回归系数)。在HO成立的条件下,回归系数b服从t分布:,将计算出的 与根据自由度df=n-2查表所得的临界t值 比较,作出结论。y变量的平方和与自由度为,(二)F 检验,由于回归和离回归的均方比遵循df1=1,

6、df2=n-2的F分布,所以,y的总平方和(SSy),dfy=n-1,离回归平方和(SS r),dfr=n-2,回归平方和(SS R),dfR=1,将计算出的F值与根据自由度df1=1, df2=n-2查表所得的临界F值 比较,作出结论。,回归关系方差分析表,F检验的结果与t检验的结果一致。统计学已证明,在直线回归分析中这二种检验法是等价的,可任选一种进行检验。,线性回归方程的应用,应用线性回归方程建立并经显著性测验证明其真实存在后,可用回归方程对依变量进行预测或控制(但自变量必须在已知的观察值范围内)。特别要指出的是:利用直线回归方程进行预测或控制时,一般只适用于原来研究的范围,不能随意把范

7、围扩大。,第二节 直线相关分析,进行直线相关分析的基本任务在于计算出表示x,y 两个变量间线性相关的程度和性质的统计量相关系数,并进行显著性检验。一、决定系数和相关系数前面已证明了等式:,从等式不难看到:y与x直线回归效果的好坏取决于回归平方和 在y的总平方和 中所占比例的大小。把比值 叫做x对y的决定系数记为r2,即,决定系数r2的大小表示了回归方程的可靠程度,显然有0r21。所以决定系数r2等于y对x的回归系数byx与x对y的回归系数bxy的乘积,即 r2=byx bxy,若求r2的平方根,统计学把这样计算所得的统计量称为x与y的相关系数,记为r,即显然相关系数 -1r1,二、相关系数和决

8、定系数的计算,充分应用计算器的统计功能键,计算: 将上述数值代入公式。,三、相关系数的显著性测验,样本相关系数r是否来自0的总体,还须对样本相关系数r 进行显著性检验。HO:=0 ,HA:0(为总体相关系数) 可采用t测验法与F测验法对相关系数r进行测验。这里只介绍常用的t 检验法。,t 测验的计算公式为:F 检验的计算公式为:,Sr相关系数标准误,此外,还可以直接采用查表法对相关系数r进行显著性检验。先根据自由度n-2查临界r值(附表8),得r0.05、 r0.01。若|r|r0.05 ,P0.05,则相关系数r不显著;若r0.05 |r|r0.01,0.01P0.05,则相关系数r显著,标

9、记“*”;若|r|r0.01,P0.01,则相关系数r极显著,标记“*”。,四、相关与回归的关系, r2=byx bxy r和b都是用一定的数值来表明两个变量之间的关系,二者变异的性质和方向完全一致;, r只能根据数值的大小的绝对值来判断两个变量间的相关程度; b则能根据自变量的变化去推算依变量的变化规律。相关系数和回归系数(方程)的显著性测验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著。,注意:在实际进行直线回归分析时,可用相关系数显著性测验代替直线回归关系显著性测验。,计算相关系数r,对r检验 (查表法),r不显著,则不建立直线回归方程,若r显著,计算回归

10、系数b、回归截距a,建立直线回归方程,五、应用直线回归与相关的注意事项,回归分析和相关分析毕竟是处理变量间关系的数学方法,在应用时要考虑到客观实际情况。要考虑到回归系数、相关系数等这些统计数的适用范围。必须严格控制被研究的两个变量以外的各个变量的变动范围, 使之尽可能为固定的常量。,为了提高回归和相关分析的准确性,两个样本的容量一般不应小于5,且使x 变量的取值范围尽可能地大一些。 正确理解“相关不显著”和“回归不显著” 一个显著的回归并不一定具有实践上的预测意义。,某实验室用两种方法,经典的燃烧法和简易的燃烧法,对相同的样品分别测其碳含量如下: (1)试问两法所得结果是否相同? (2)两法所测含量是否存在线性的相关和回归关系? (3)简易法能否代替经典法,道理何在?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报