收藏 分享(赏)

9简单相关回归分析.ppt

上传人:fmgc7290 文档编号:6411554 上传时间:2019-04-12 格式:PPT 页数:62 大小:1.68MB
下载 相关 举报
9简单相关回归分析.ppt_第1页
第1页 / 共62页
9简单相关回归分析.ppt_第2页
第2页 / 共62页
9简单相关回归分析.ppt_第3页
第3页 / 共62页
9简单相关回归分析.ppt_第4页
第4页 / 共62页
9简单相关回归分析.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

1、第八章 线性相关与回归分析,第一节 回归与相关分析的概念 第二节 线性相关回归方案设计 第三节 线性回归分析 第四节 线性相关分析,引言这一章研究的对象: 由一个变数 两个或多个变数,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如: 研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数; 研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。,函数关系 有精确的数学表达式(确定性的关系) 直线回归分析一元回归分析 变量间的关系 因果关系 曲线回归分析(回归分析) 多元回归分析 多元线性回归分析统计关系 多元非线性回归分析(非确定性的关系) 简单相关分

2、析 直线相关分析相关关系 复相关分析(相关分析) 多元相关分析 偏相关分析,一、相关和回归分析的定义 1、函数关系与统计关系 函数关系:变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。 统计关系:变量间不存在完全的确定性关系,不能用精确的数学公式来表示,这类受误差影响的变量间的关系称为统计关系 。,第一节 回归与相关分析的概念,因果关系:两个变数间的关系若具有原因和反应(结果)的性质。 相关关系:呈现一种共同变化的特点,则称这两个变数间存在。 回归分析:计算回归方程为基础的统计分析方法。,x,生物产量(g) 水稻单株生物产量与稻谷产量的散点图,x,每m2颖花数(万) 水稻每m2颖花

3、数和结实率的散点图,x,最高叶面积指数 水稻最高叶面积指数和亩产量的散点图,2、相关分析(correlation analysis) 研究两个或两个以上变量的相关的程度和性质,也就是研究两种以上事物的共同变化规律:即X变化时,Y是否同时发生变化;两种变量的变化趋势是一致,还是相反的,以及一致和相反的程度。对两个变量之间的直线关系进行相关分析称为直线相关或简单相关;对多个变量之间的直线关系进行相关分析,研究一个变量与多个变量间的线性相关称为复相关分析(多元相关分析);研究其余变量保持不变的情况下两个变量间的线性相关称偏相关分析。,3、回归(regression analysis)研究存在因果关系

4、一种变量受另一种或几种变量的影响程度,揭示变量之间的联系形式,建立回归方程,利用回归方程对自变量或依变量进行控制或预测。一个自变量与一个因变量的回归分析称为一元回归分析;多个自变量与一个因变量的回归分析称为多元回归分析。一元回归分析可分为直线回归和曲线回归两种;多元回归分析可分为多元线性回归和多元非线性回归两种。,4、相关与回归分析的区别 相关分析的任务是确定两个变量之间是否存在相关,以及相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系与程度的表达式。 相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。 相关分析中两变量是对等,改变两者的位

5、置不影响相关系数的数值的大小。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。 相关分析中两变量可以都是随机的,而回归分析中因变量X是随机的,依变量Y不是随机的。,二、相关回归分析中应该注意的问题,1、相关与回归仅是作为一种工具帮助有关的认识和解释,变量间是否存在相关,以及在什么条件下发生相关等问题,都必须由各学科本身来决定,绝不能以不相干的数据随意凑在一起作相关回归分析。 2、由于自然界各种事物间的相互联系和制约,一个事物的变化通常要受到许多其它事物的影响,因此如果仅仅研究事物Y与X的关系时,要求其它事物尽可能得到严格控制;否则相关与回归分析有可能导致完全虚假的结果。 3、

6、为了提高相关与回归分析的准确性,两个变量的成对观察值应尽可能多一些,一般至少要在5对以上的观察值,最佳数对为10-30对,并且尽可能使X变量的取值范围大些。,相关和回归的类型可分为:1.按研究变数的数目分为简单相关回归和多元相关回归。前者指研究两个变数的关系;后者指研究两个以上变数间的关系。2.按变数间关系的图形可分为线性与非线性相关回归。,相关与回归的异同点:(以两个变数为例) 相同:都是研究两个变数间关系的。不同则为:,第二节 线性反应试验方案设计,一、等差间隔的试验方案设计 所谓等差是指试验因素X的取值是按照相等的差距设计的。 如研究葡萄扦插苗高与扦后天数的关系;中间砧长度与矮化效果等。

7、研究中一般对天数、中间砧木长度采用等差便于试验结果的研究与分析。这种方法一般适用于直线相关与回归研究中应用。,二、等比间隔试验方案设计,所谓等比是指试验因素X的取值是按照相同的比值设计的。一般适用于试验效应与试验因素间呈对数关系或指数关系的试验设计研究中使用。 如:叶面喷施B9与苹果新梢生长量的关系研究;1000、2000、4000、ck。,三、优选法间隔试验方案设计(0.618法),所谓优选法间隔试验方案设计,就是以试验因素的上限与下限为两个端点,以上限与下限之差乘以0.618的积为水平间隔,从两端向中间展开。 如已知:葡萄花前10天叶面喷施15%多效唑可以提高巨峰葡萄的座果率,而且有效区间

8、为500-1200PPM,此时用1200-500=700 700*0.618=423.6; 即可设计出处理浓度为:500+423.6=923.6;1200-423.6=776.4加上500;1200;0试验方案设计出5个处理点。即为0.618法设计。,优选法适合于试验效应与因素间呈二次曲线型反应的试验方案设计,该设计的中心目的是在试验中寻找出最佳处理值(极值点)。但是本试验设计方案在使用中应该首先对试验内容有一个基本的了解,即要知道有效使用区间(上限与下限)才能正确使用。,第三节 线性回归,一、线性回归方程的建立方法步骤1、描散点图,找出对应线段类型;2、确定线段类型,找出对应数学计算公式;3

9、、数学运算求出回归系数与回归截距;4、写出回归方程。,对于直线回归来讲只有当线段类型呈直线趋势时,才能作为直线看待,此时对应的数学公式为 ,读作y依x的回归方程。式中x、y为实际观察值,b称为回归系数,指的是当x每增加一个单位数时y要增加(b0)或减少(b0)的单位数也称为斜率,a称为回归截距。 表示由x值计算得到的y的估计值。,二、线性回归方程,三、回归系数和回归截距的计算,回归系数表面上看是斜率,只要由两个点就可以求得,但是实际上由于各点数值与直线均有一定的偏离,所以不能用任意两点的观察值计算得出,必须借用数学中的最小二乘法原理来解决。 根据最小二乘法原理,a、b应使回归估计值与观测值的偏

10、差平方和最小,即:,二、回归系数和回归截距的计算,1、回归系数和回归截距的计算 要使Q为最小,根据微积分学中的极值原理,令 Q对a、b的一阶偏导数等于0 ,即:,也就是:对以上方程组求解得出:,2、直线回归的偏离度估计 离回归标准误 的大小表示了回归直线与实测点偏差的程度,即回归估测值 实际观测值y偏差的程度,于是我们用离回归标准误 来表示回归方程的偏离度。,2、回归方程的验证将 代入方程式得: 否则方程是错误的。3、回归直线的绘制回归直线的绘制从理论上讲任意二点连线即可绘声绘色出直线,但由于偏回归的存在因此必须用 两个点连线绘出直线才是真正的回归直线,因为这两个点是直线上最有代表性的两个点。

11、,1、直线回归的变异来源,三、直线回归的显著性测验,总变异 SSy 离回归SSe 回归SSR,2、回归关系显著性检验F检验x与y之间是否存在回归关系,需要进行假设测验,首先提出其无效假设:=0,备择假设:0。在无效假设成立的条件下,回归均方与离回归均方的比值服从F分布,所以可以用以下公式进行计算和测验。,3、回归系数的显著性测验用回归系数的显著性测验用T检验,也可检验x与y间是否存在直线关系。回归系数显著性检验的无效假设和备择假设分别为:0,0。,4、回归关系与回归系数显著性之间的关系,对直线相关与回归的显著测验,由于大方差自由度等于1,存在t2=F的关系;所以回归系数、回归关系、相关系数、相

12、关关系显著性测验实质上是一回事,所以在具体应用时只进行一个测验,其它不再作测验,其差异显著性测验只是方法上的不同。,第四节 线性相关,一、度量相关程度的基本公式 设有一双变数总体,具有n对 的观测值为:此时如果 与 正相关:则 大值与 大值在一起;小值与 小值在一起;如果 与 负相关:则 大值与 小值在一起; 小值与 大值在一起; 在这两变数的资料中:变量方面, 为最有代表性的观测值;变量方面, 为最有代表性的观测值;,各个变量值变异度的大小可用离均差表示:如果用离均差除以变量的标准差就可以得到一个不带任何单位的纯数;即为:,相关系数这些纯数对的乘积的和除以自由度所得到的商。即为:,经过对公式

13、进一步的整理得:,相关系数的取值区间为-1-+1,,一、相关系数和决定系数,(一)相关系数(X,Y )总体没有相关,则落在象限、的点是均匀分散的,因而正负相消, = 0。,当(X,Y )总体呈正相关时,落在象限、的点一定比落在象限、的多,故 一定为正;同时落在象限、的点所占的比率愈大,此正值也愈大。,当(X,Y )总体呈负相关时,则落在象限、的点一定比落在象限、的为多,故 一定为负;且落在象限、的点所占的比率愈大,此负值的绝对值也愈大。,二、相关系数的计算,甜樱桃杂种实生苗蜜腺大小与果实重量的相关系数计算 : X 1.6 1.6 1.8 1.9 2 2 2.1 2.2 2.3 2.4 Y 3

14、3.2 3.6 3.7 4 4.2 4.4 4.5 5 5.1 输入X资料求: 输入Y资料求: 输入XY资料求: 求r =0.98 最后根据df =n-2和自变数个数查R表:即可得出0.05和0.01值大小,如果实际计算出来的0.05就认为差异显著;如果r 0.05就认为差异不显著,说明X与Y之间不存在相关关系。 本例:df=10-2=8;自变数为1,变数为2,查表得: 0.05=0.632 0.01=0.765,样本相关系数r是否来自0的总体,还须对样本相关系数r进行显著性检验。此时无效假设、备择假设为:=0,:0。 与直线回归关系显著性检验一样,可采用t检验法与F检验法对相关系数r的显著性

15、进行检验。,三、相关系数的显著性测验,相关系数r显著性t检验临界r值见附表,可以直接采用查表法对相关系数r进行显著性检验。具体作法是:先根据自由度n-2查临界r值,得 。 若|r| ,则相关系数r不显著; 若 |r| ,则相关系数r显著,在r的右上方标记“*”; 若|r| ,则相关系数r极显著,在r的右上方标记“*”。,F检验的计算公式为,四、相关关系的显著性测验,五、相关系数的应用,决定系数:相关系数的平方即r2称为决定系数,用以说明Y变量(或X变量)的变异中可由X (或y变量)来解释 的比例。 相关系数的显著性与相关程度有时不是一回事,例如在小样本时需要较大的r值才能达到显著水平,此时相关

16、程度与相关显著性保持一致,在生产上具有较大的意义;但对于大样本往往较小的r值也能达到显著水平,但是实际上相关程度并不高, 如:df=50时 0.05=0.276 df=100时 0.05=0.195 df=1000时 0.05=0.062,在进行两个变数的相关回归研究中,对相关系数、回归系数的t测验以及回归关系的假设测验结果完全一致。,六、线性相关与回归的关系,1、r和b都是用一定数值表明两个变数之间的依存关系的;两者的变异性质和方向是完全一致的。 2、r只能根据数值的大小来判断两类变数间的相关程度;b则是根据数值大小得到回归方程,从而根据自变数的变化去推测依变灵敏的变化规律;r的数值总是在-

17、1与+1之间,而b的数值则变化较大。,总之若相关回归仅研究两类变数间的关系,则由于大方差自由度等于1,则回归关系的显著性、回归系数的显著性、相关系数的显著性三者完全一致,所以在实际应用中只要求出一个显著了,其它均为显著,但是在科学研究中,有些研究内容虽然存在相关关系,但并一定存在回归关系,因此必须具体问题具体分析做一个一个研究。,四、线性相关与回归的关系,第四节 非线性回归,前面我们研究了线性相关与回归,但是在生产科研中,有许多被研究的现象之间,并不是呈现线性关系,而呈现出曲线相关与回归关系,如果实的生长发育动态、新梢的生长动态等等。而且呈现出不同的类型,因此我们还必须对曲线相关与回归作以具体

18、的研究。,1、多项式曲线 (1)y=a+bx (2)y=a+bx+cx2 (3)y=a+bx+cx2+dx3,2、指数曲线,3、对数曲线,4、倒数曲线,为双曲线,当b0时,曲线由上向下如图7-18A;当b0时,曲线由下向上如图;,5、S型曲线,曲线呈S型,上面有一条渐近线。,应用Excel表作曲线回归分析,1、在表中输入数据 2、选中数据,点“标准类型”,选“XY散点图” 3、点“下一步”,点“完成”。显示图形 在表中出现一个曲线图 4、在“曲线上一个点上” 点右键,选“添加趋势线” 5、确定曲线类型,选择合适“曲线图标”点中 6、点”选项”中,选择“显示公式,显示R平方值”二项 最后“确定”

19、即完成,具体操作如下:,X=1 2 3 4 5 Y=4 6 8 10 8 在EXCEL表选中数据 插入 图表 XY散点图 下一步 完成 显示下列图标,在数据点上点右键,右键点击 添加趋势曲线 选择一个线型的趋势 点中“选项”在下列方框中打对号 设置截距(S) 显示公式(E) 显示平方值(R) 显示出图形与方程式如下图:,相关与回归分析流程图,小 结,本章节介绍了确定两个因子之间关系的一种分析方法,同时介绍了回归方程的计算方法,但在实际应用中,原则上不必要用计算器去一步一步计算,可以直接用Excel直接进行分析,然后去查R表就可以得到你所需要的结果。在此本章节的重点是应用Excel做相关回归分析。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报