1、本章优化总结,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法由于散点图中样本点分布不同,回归分析分为两种,一种是线性回归分析,一种是非线性回归分析在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归直线方程来预报,若样本点大致分布在一条曲线附近,则利用转化思想,让其大致分布于一条直线附近,利用线性回归分析的方法来解决研究某灌溉渠道内水的流速y与水深x之间的关系时,测得8组数据如下表所示:,(1)求y对x的回归方程;(2)预测该渠道内水深为1.95 m时水的流速(精确到0.01 m/s)【分析】根据所给数据作出散点图,由散点图直观地判断变量x与y之间
2、有无线性相关关系若相关,则利用线性回归模型求解根据求得的回归方程即可预测水的流速,【解】(1)根据表中的数据作出散点图,如图所示由散点图可知,x、y线性相关,计算结果表明,当水深为1.95 m时,可以预测该渠道内水的流速约为2.12 m/s.【点评】回归分析的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否合适等,某地区不同身高的未成年男性的体重平均值如下表所示:,(1)试建立y与
3、x之间的回归方程;(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于平均值的0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为82 kg的在校男生的体重是否正常?【分析】由题意,先通过散点图来确立样本点分布的函数,再把这个函数转化为线性相关函数进行求解,【解】(1)根据表中的数据作出散点图,如图从图中可以看出,样本点分布在某条指数型函数曲线yc1ec2x的附近,其中c1,c2为待定参数于是令zlny,则zc2xlnc1,变换后样本点应该分布在直线zbxa(alnc1,bc2)的周围根据题意,得到x与z的数据如下表所示:,【点评】非线性回归问题的解法:解非线性回归问题时,要采
4、用转化化归的思想,把根据已知数据画出的散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合最好的函数,然后采取适当的变量代换,把问题转化为线性回归分析问题,使问题得到解决,独立性检验的基本思想(1)独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法常用的直观方法为等高条形图,等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用假设检验的思想方法,计算出某一个随机变量K2的观测值来判断更精确些,(2)独立性检验要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成
5、立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理特别提醒:K2的观测值k的计算是关键点,也是易错点,所以计算时一定要认真仔细,切勿在计算中出现错误,某运动队研制了一种有助于运动员在大运动量的训练后快速恢复的口服制剂,为了试验新药的效果,抽取了若干名运动员来试验,所得资料如下:,区分该种药剂对男、女运动员产生的效果的强弱【分析】确定哪两个变量之间的关系,就找那两个变量构成的列联表,求出K2的观测值k,然后查表下结论,【点评】独立性检验的一般步骤:(1)提出假设H0:和没有关系;(2)根据22列联表计算K2的观测值;(3)根据K2的观测值与临界值的大小关系作统计推断,本部分内容讲解结束,按ESC键退出全屏播放,