1、8 最小二乘估计,1.最小二乘法 如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度: y1-(a+bx1)2+y2-(a+bx2)2+yn-(a+bxn)2. 使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法. 2.回归直线方程,【做一做1】 已知x与y之间的一组数据如下表:,则y与x的线性回归方程y=bx+a,必过点( ) A.(2,3) B.(1.5,3) C.(1.5,3.25) D.(2,3.25),答案:C,3.线性回归分析 利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈现
2、一定的规律性,我们再根据这个规律进行拟合.如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的曲线进行拟合. 规律总结线性回归分析的步骤: (1)作散点图,判断两个变量是否线性相关,若是,再执行以下步骤;,(4)代入公式计算b,a的值; (5)写出线性回归方程; (6)根据回归系数的意义进行估计和判断.,【做一做2】 设有一个回归方程为 =-1.5x+2,则变量x增加一个单位时( ) A.y平均增加1.5个单位 B.y平均增加2个单位 C.y平均减少1.5个单位 D.y平均减少2个单位 解析:两个变量线性负相关,变量x增加一个单位
3、,y平均减少1.5个单位. 答案:C,思考辨析 判断下列说法是否正确,正确的在后面的括号里画“”,错误的画“”. (1)散点图能直观地反映数据的相关程度. ( ) (2)任意一组数据都有一个对应的线性回归方程. ( ) (3)散点图中的点越集中,两个变量的相关性越强. ( ) (4)线性回归方程最能代表线性相关的两个变量之间的关系. ( ),答案:(1) (2) (3) (4) (5),探究一,探究二,探究三,思想方法,当堂检测,求线性回归方程 【例1】某市近5年的煤气消耗量与使用煤气户数如下表:,(1)检验变量x,y是否线性相关; (2)求y对x的线性回归方程. 分析:根据表中的数据作出散点
4、图判断是否线性相关若是,则根据公式求得a,b得线性回归方程,探究一,探究二,探究三,思想方法,当堂检测,解:(1)作出散点图,由散点图知变量x,y线性相关.,探究一,探究二,探究三,思想方法,当堂检测,探究一,探究二,探究三,思想方法,当堂检测,变式训练1若在一次试验中,测得(x,y)的四组数值分别是A(1,3), B(2,3.8),C(3,5.2),D(4,6).则y与x之间的线性回归方程是( ) A.y=x+1.9 B.y=1.04x+1.9 C.y=0.95x+1.04 D.y=1.05x-0.9 答案:B,探究一,探究二,探究三,思想方法,当堂检测,回归直线的性质 【例2】 下表提供了
5、某种产品投入的广告费用x(单位:万元)与相应销售金额y(单位:十万元)的几组数据,根据上表提供的数据,求出y关于x的线性回归方程是y=0.25x+1.75,后来表中的某个数据被污染,则被污染的数据最有可能是( ) A.2.8 B.2.5 C.2.6 D.3.6,探究一,探究二,探究三,思想方法,当堂检测,答案:B 反思感悟回归直线y=bx+a一定经过样本点的中心 ,根据这一性质可以快速地确定回归直线系数的值或者根据回归系数的值确定未知数据.,探究一,探究二,探究三,思想方法,当堂检测,变式训练2已知x,y的取值如下表所示,答案:B,探究一,探究二,探究三,思想方法,当堂检测,利用线性回归方程对
6、总体进行估计【例3】 对具有线性相关关系的变量x,y,测得一组数据如下:,根据上表,利用最小二乘法得它们的回归直线方程为y=10.5x+a,据此模型来预测当x=20时,y的估计值为 ( ) A.210 B.210.5 C.211.5 D.212.5 解析:由数据可知 ,代入回归直线方程得a=1.5,所以y=10.5x+1.5,当x=20时,y=10.520+1.5=211.5. 答案:C 反思感悟1.利用线性回归方程对总体进行估计,关键在于正确地求出线性回归方程. 2.利用线性回归方程进行预测和估计时,所得到的结果只是一个估计值,而不是精确值.,探究一,探究二,探究三,思想方法,当堂检测,变式
7、训练3(1)根据下表样本数据:,得到的回归方程为y=bx+a.若a=7.9,则x每增加1个单位,y就( ) A.增加1.4个单位 B.减少1.4个单位 C.增加1.2个单位 D.减少1.2个单位 (2)从某一行业随机抽取12家企业,它们的生产量与生产费用的数据如表所示:,探究一,探究二,探究三,思想方法,当堂检测,绘制生产量x和生产费用y相应数据对应的散点图. 如果两个变量之间是线性相关关系,请用最小二乘法求出其线性回归方程. 如果一个企业的生产量是120台,请预测它的生产费用.,探究一,探究二,探究三,思想方法,当堂检测,答案:B (2)解:散点图如图所示:,根据散点图可知,两个变量x和y之
8、间的关系是线性相关关系.下面用最小二乘法求线性回归方程:,探究一,探究二,探究三,思想方法,当堂检测,探究一,探究二,探究三,思想方法,当堂检测,(3)在线性回归方程y=0.42x+124.22中,常数项124.22可以认为是固定费用,它不随生产量的变化而变化;0.42可以认为是可变费用的增长系数,即每增加1个单位的生产量就增加0.42个单位的费用.将x=120代入线性回归方程得y=0.42120+124.22=174.62,即如果一个企业的生产量是120台,它的生产费用约为174.62万元.,探究一,探究二,探究三,思想方法,当堂检测,线性回归方程的求法与应用 【典例】一个车间为了规定工时定
9、额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:,(1)画出散点图. (2)求线性回归方程. (3)关于加工零件的个数与加工时间,你能得出什么结论? 分析:(1)横坐标表示加工零件个数,纵坐标表示加工时间,建立平面直角坐标系即可绘制散点图. (2)利用散点图中点的走势即可得出变量之间是否线性相关,然后利用最小二乘法求出线性回归方程,利用方程得出(3)中的预测结论.,探究一,探究二,探究三,思想方法,当堂检测,解:(1)散点图如图所示.由散点图知二者呈线性相关关系.,探究一,探究二,探究三,思想方法,当堂检测,(2)设线性回归方程为y=bx+a. 列表并利用科学计算器进行有
10、关计算.,故所求线性回归方程为 y=0.668x+54.96. (3)由线性回归方程可以得出每多加工10个零件,就多花费6.68时.,探究一,探究二,探究三,思想方法,当堂检测,方法点睛1.解决此类问题,因为已知y与x线性相关,所以只需代入公式进行求解,鉴于代入很烦琐,因此要分步来求解,并且要注意运算结果的正确性. 2.根据线性回归方程来进行预测或估计时,要注意明确方程中的各个量在实际问题的含义,不要混淆,做到有的放矢. 3.线性回归方程中的回归系数b代表x每增加一个单位,y平均增加的单位数,而不是增加单位数,也就是说,此时对y的预测是平均预测.,探究一,探究二,探究三,思想方法,当堂检测,变
11、式训练下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对应数据.,(1)请画出表中数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的回归直线方程,预测技改后生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?,探究一,探究二,探究三,思想方法,当堂检测,解:(1)由题设所给数据可得散点图,如图所示.,因此,所求的回归直线方程为y=0.7x+0.35. (3)由(2)的回归直线方程及技改前生产100吨甲产
12、品的生产能耗,得降低的生产能耗为90-(0.7100+0.35)=19.65(吨标准煤).,探究一,探究二,探究三,思想方法,当堂检测,1.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的线性回归方程为y=50+80x,下列判断正确的是 ( ) A.劳动生产率为1 000元时,工资为130元 B.劳动生产率提高1 000元,则工资平均提高80元 C.劳动生产率提高1 000元,则工资平均提高130元 D.当月工资为210元时,劳动生产率为2 000元 答案:B 2.下列命题:线性回归方法就是寻找一条贴近已知样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用
13、线性关系来表示;通过线性回归方程y=bx+a可以估计和预测变量的取值和变化趋势. 其中正确的命题是( ) A. B. C. D. 答案:D,探究一,探究二,探究三,思想方法,当堂检测,3.下表是x与y之间的一组数据,则y关于x的回归直线必过点( ),A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4),答案:D,探究一,探究二,探究三,思想方法,当堂检测,4.登山族为了了解某山高y(单位:km)与气温x(单位:)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:,由表中数据,得到线性回归方程y=-0.2x+a(aR),由此估计出山高为7.2 km处的气温为( ) A
14、.-10 B.-8 C.-6 D.-4 ,答案:C,探究一,探究二,探究三,思想方法,当堂检测,5.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为 =0.72x-58.2,张明同学(20岁)身高178 cm,他的体重应该在 kg左右. 解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,=0.72178-58.2=69.96(kg). 答案:69.96,探究一,探究二,探究三,思想方法,当堂检测,6.某车间为了规定工时定额,需要确定加工某零件所花费的时间,为此做了四次实验,得到的数据如下:,(1)求出y关于x的线性回归方程. (2)试预测加工10个零件需要多少时间?,故a=2.75-0.83.5=-0.05, 所以y=0.8x-0.05. (2)将x=10代入回归直线方程,得y=0.810-0.05=7.95. 所以预测加工10个零件需要7.95时.,