1、课题导入,前面我们已经初步学习了线性回归分析这节课我们继续来对回归模型的建立和分析做一些探讨,本节课我们将介绍相关知识,回归分析3 回归模型的建立及分析,目标引领,了解随机误差、残差、残差分析的概念; 会用残差分析判断线性回归模型的拟合效果; 掌握建立回归模型的步骤; 通过对典型案例的探究,了解回归分析的基本思想方法和初步应用,回归分析 回归分析是对具有_的两个变量进行统计分析的一种常用方法 线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数ybxa描述它们之间的关系,因此用线性回归模型ybxae来表示,其中a、b为未知参数,e为_ ,1,2,相关
2、关系,随机误差,独立自学,刻画回归效果的方式,3,样本编号,身高数据,残差,体重估计值,越小,解释,预报,为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:,【例1】,(1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析 思路探索 作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄,引导探究,自主解答 (1)散点图如图,(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新
3、建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系 规律方法 当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面,下表为收集到的一组数据:,【例2】,(1)作出x与y的散点图,并猜测x与y之间的关系; (2)建立x与y的关系,预报回归模型并计算残差; (3)利用所得模型,预报x40时y的值 审题指导 (1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关由散点图得x、y之间的回归模型 (2)进行拟合,预报回归模型,求回归方程,规范解答 (1
4、)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1、c2为待定的参数 (4分),(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,(aln c1,bc2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:,(10分),(3)当x40时,ye0.272x3.8491 131. (12分),小结 解决非线性回归问题的方法及步骤 (1)确定变量:确定解释变量为x,预报变量为y; (2)画散点图:通过观察散点图并与学过的函数(幂、
5、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型; (3)变量置换:通过变量置换把非线性问题转化为线性回归问题; (4)分析拟合效果:通过计算相关指数等来判断拟合效果; (5)写出非线性回归方程,一般地,建立回归模型的基本步骤为:,(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。,(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。,(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).,(4)按一定规则估计回归方程中的参数(如最小二乘法)。,(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。,目标升华:,为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:,(1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;(2) 描述解释变量与预报变量之间的关系;(3) 计算残差、相关指数R2.,解:(1)散点图如右所示,当堂诊学,(2)由散点图看出样本点分布在一条指数函数y= 的周围,于是令Z=lny,则,由计数器算得 则有,(3),即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.,强化补清,完成教材全解相关内容,