1、课堂探究探究一 求线性回归直线方程(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义【典型例题 1】某商场经营一批进价是 30 元/件的小商品,在市场试验中发现,此商品的销售单价 x(x 取整数)元与日销售量 y 台之间有如下关系x 35 40 45 50y 56 41 28 11(1)y 与 x 是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程(方程的斜率
2、保留一个有效数字)(2)设经营此商品的日销售利润为 P 元,根据(1)写出 P 关于 x 的函数关系式,并预测当销售单价 x 为多少元时,才能获得最大日销售利润解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关设回归直线为 x ,由题知 42.5, 34,y b a x y则求得b 4i 1xi xyi y4i 1xi x2 3. 370125 34(3)42.5161.5.a y b x 3x161.5.y (2)依题意有P(3x161.5)( x30)3x 2251.5x 4 8453 2 4 845.(x 251.56 ) 251.5212当 x
3、42 时,P 有最大值,约为 426.251.56即预测当销售单价为 42 元时,才能获得最大日销售利润规律总结 先根据所给数据画出散点图,判断 y 与 x 是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识求出日销售利润最大时的销售单价探究二 线性回归分析解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数 R2 来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析【典型例题 2】在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为:x(元) 14
4、16 18 20 22y(件) 12 10 7 5 3且知 x 与 y 具有线性相关关系,求出 y 对 x 的回归直线方程,并说明拟合效果的好坏解: (1416182022) 18,x15 (1210753)7.4 ,y1514 216 218 220 222 21 660,5i 1x2i12 210 27 25 23 2327,5i 1y2iiyi 14121610187205223620,5i 1x 1.15.b 5i 1xiyi 5x y5i 1x2i 5x2 620 5187.41 660 5182 4640 7.41.151828.1,a 回归直线方程为 1.15x28.1.y 列出
5、残差表为yi iy 0 0.3 0.4 0.1 0.2yi y 4.6 2.6 0.4 2.4 4.4 (yi )20.3, (yi )253.2,5i 1 yi 5i 1 yR21 0.994.5i 1yi yi 25i 1yi y2故 R20.994,说明拟合效果较好规律总结 “相关指数 R2、残差图”在回归分析中的作用:(1)相关指数 R2 是用来刻画回归效果的,由 R21 可知 R2 越大,意味着残ni 1yi yi 2ni 1yi y2差平方和越小,也就是说模型的拟合效果就越好(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型
6、拟合精度越高, 回归方程预报精度越高探究三 求非线性回归方程非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图把它与必修模块数学 1 中学过的各种函数(幂函数、指数函数、对数函数等) 图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决【典型例题 3】假设关于某设备的使用年限 x 和支出的维修费用 y(万元),有如下表的统计资料:使用年限 x 2 3 4 5 6维修费用 y 2.2 3.8 5.5 6.5 7.0若由资料知 y 与 x 具有线性相关关系,试求:(1)线性回归方程 x .y b a (2)估计使用年限为
7、 10 年时,维修费用是多少?(3)计算总偏差平方和、残差平方和及回归平方和(4)求 R2 并说明模型的拟合效果解:(1)将已知条件制成下表i 1 2 3 4 5 合计xi 2 3 4 5 6 20yi 2.2 3.8 5.5 6.5 7.0 25xiyi 4.4 11.4 22.0 32.5 42.0 112.3x2i 4 9 16 25 36 904; 5; 90; iyi112.3x y5i 1x2i5i 1x设回归方程为 x ,y b a 于是有 1.23, 51.2340.08,b 5i 1xiyi 5x y5i 1x2i 5x2 112.3 54590 542 a y b x所以线
8、性回归方程是 1.23x0.08.y (2)当 x10 时, 1.23100.0812.38,y 即估计使用 10 年时维修费用是 12.38 万元(3)总偏差平方和: (yi )215.78,5i 1 y残差平方和: 2.460.082.54, 3.77, 5, 6.23, 7.46, (yiy1 y2 y3 y4 y5 5i 1)2 0.651,yi 回归平方和:15.780.65115.129.(4)R2 1 1 0.958 7,5i 1yi yi 25i 1yi y2 0.65115.78模型的拟合效果较好,使用年限解释了 95.87%的维修费用支出规律总结 把非线性回归问题转化为线性
9、回归问题,拓展了解题思路探究四 易错辨析易错点 残差平方和与相关指数的理解不清致误【典型例题 4】对两个变量 y 和 x 进行回归分析,得到一组样本数据:( x1,y 1),(x2,y 2), (xn,y n),则下列说法中不正确的是 ( )A由样本数据得到的回归方程 x 必过样本点的中心 ( , )y b a x yB残差平方和越小的模型,拟合的效果越好C用相关指数 R2 来刻画回归效果, R2 的值越小,说明模型的拟合效果越好D若变量 y 和 x 之间的相关系数 r0.936 2,则变量 y 和 x 之间具有线性相关关系错解:B错因分析:对残差平方和和相关指数 R2 理解错误正解:R 2 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好答案:C