1、线性回归方程【目标引领】1学习目标:了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握回归直线方程的求解方法。2学法指导:求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义否则,求出的回归直线方程毫无意义因此,对一组数据作线性回归分析时,应先看其散点图是否成线性求回归直线方程,关键在于正确地求出系数 a、b,由于求 a、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误回归直线方程在现实生活与生产中有广泛的应用应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充因此,学过回归
2、直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识【教师在线】1解析视屏:1相关关系的概念在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示。例如正方形的面积 S 与其边长 x之间的函数关系 2xS(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。例如一块农田的水稻产量与施肥量的关系(非确定关系)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。相关关系与函数关系的异同点:相同点:均是指两个变量的关系。不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与
3、因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。2求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量 x 与 y 之间关系的直线的特征:即 n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为 yba,其中 a、b 是待定系数。则 (1,2)iiybxan,于是得到各个偏差。,.iii显见,偏差 iy的符号有正负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用 n 个偏差的平方和2221()().()nQbxybxay
4、bxa表示 n 个点与相应直线在整体上的接近程度。记21()iiiya。上述式子展开后,是一个关于 a,b 的二次多项式,应用配方法,可求出使 Q 为最小值时的 a,b 的值,即 xbyan1i2nii其中 11,nniixy以上方法称为最小二乘法。2经典回放:例 1:下列各组变量哪个是函数关系,哪个是相关关系?(1)电压 U 与电流 I(2)圆面积 S 与半径 R(3)自由落体运动中位移 s 与时间 t(4)粮食产量与施肥量(5)人的身高与体重(6)广告费支出与商品销售额分析:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关
5、系;而相关关系是非随机变量与随机变量的关系。 解:前三小题中一个变量的变化可以确定另一个变量的变化,两者之间是函数关系。对于粮食与施肥量,两者确实有非常密切的关系,实践证明,在一定的范围内,施肥量越多,粮食产量就越高,但是,施肥量并不能完全确定粮食产量,因为粮食产量还与其他因素的影响有关,如降雨量、田间管理水平等。因此,粮食与施肥量之间不存在确定的函数关系。人的身高与人的体重也密切相关,一般来说,一个人的身高越高,体重也越重,但同样身高的人,其体重不一定相同,身高和体重这两个变量之间并不是严格的函数关系。广告费支出与商品销售额有密切的关系,但广告费的支出不能完全决定商品的销售额。由此可见,后三
6、小题各对变量之间的关系是相关关系。点评:不要认为两个变量间除了函数关系,就是相关关系,事实是上,两个变量间可能毫无关系。比如地球运行的速度与某个人的行走速度就可认为没有关系。例 2:已知 10 只狗的血球体积及红血球的测量值如下: 45 42 46 48 42 35 58 40 39 50y 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72(血球体积,),(血红球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形。解:()见下图x30y51035 40 45 50 55() 0.4)39828642(1x 37.)2.8562.4
7、.0.59.0.75.930.6y设回归直线为 abxy,则 176.0xnya1i2nii, 64.0xayb所以所求回归直线的方程为 4y,图形如下:x30y51035 40 45 50 55点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数 a、b 的计算公式,算出 a、b由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误求线性回归方程的步骤:计算平均数 yx,;计算iyx与 的积,求 iyx;计算 2ix;将结果代入公式求;用 xayb求;写出回归方程。【同步训练】1 . 下列两个变量之间的关系哪个不是函数关系( )A角度和它的余弦值
8、 B.正方形边长和面积C正边形的边数和它的内角和 D.人的年龄和身高2某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为 y=50+80x,则下列说法中正确的是 ( )A劳动生产率为 1000 元时,月工资为 130 元B劳动生产率提高 1000 元时,月工资提高约为 130 元C劳动生产率提高 1000 元时,月工资提高约为 80 元D月工资为 210 元时,劳动生产率为 2000 元3设有一个回归方程为 y=2-1.5x,则变量 x 每增加一个单位时,y 平均 ( )A增加 1.5 单位 B增加 2 单位 C减少 1.5 单位 D减少 2 单位 4正常情况下,年龄在 18 岁到
9、 38 岁的人们,体重 y(kg)依身高 x(cm)的回归方程为 y=0.72x-58.5。张红红同学不胖不瘦,身高 1 米 78,他的体重应在 kg 左右。5.给出施化肥量对水稻产量影响的试验数据:施化肥量 x 15 20 25 30 35 40 45水稻产量 y330345365405445450455(1)画出上表的散点图;(2)求出回归直线并且画出图形 【拓展尝新】6在某种产品表面进行腐蚀线试验,得到腐蚀深度 y 与腐蚀时间 x 之间对应的一组数据:时间t(s)5101520304050607090120深度y(m)610101316171923252946(1)画出散点图;(2)试求
10、腐蚀深度 y 对时间 t 的回归直线方程。【解答】1 D 2C 3C 469.66 5解:(1)散点图(略)(2)表中的数据进行具体计算,列成以下表格i 1 2 3 4 5 6 7xi 15 20 25 30 35 40 45yi 330 345 365 405 445 450 455xiyi495069009125121501557518000204753.9, 777221110,3,8ii ixyxy故可得到 25730.439a.4785b。6解:(1)散点图略,呈直线形.(2)经计算可得: 4.19y,6.t1i 1ii21i2 30t,5,3670t542.36.045.19a9.b故所求的回归直线方程为 .t0y。